精华内容
下载资源
问答
  • 筛选或删除文档中的不规则字符,比如中文字符。 把带有音调的字母替换成没有音调的普通字母,特别是拼音转换。 例如,制作一个比较全的姓氏拼音字典。首先去网上找一个常用姓氏拼音表。我随便找了一个: 百家姓...

    bash&shell系列文章:http://www.cnblogs.com/f-ck-need-u/p/7048359.html


    有时候我们对文档过滤会有这样的需求:

    1. 筛选或删除文档中的不规则字符,比如中文字符。
    2. 把带有音调的字母替换成没有音调的普通字母,特别是拼音转换。

    例如,制作一个比较全的姓氏拼音字典。首先去网上找一个常用姓氏拼音表。我随便找了一个:

    百家姓全文(按拼音排序)  【A】  安(ān)  敖(áo)  艾(ài)  爱(ài)  【B】  巴(bā)白(bái) 鲍(bào) 包(bāo) 暴(bào) 班(bān) 柏(bǎi) 毕(bì) 卞(biàn) 边(biān)    薄(bó)  伯(bó)  卜(bǔ)  步(bù)   贝(bèi)  贲(bēn)  邴(bǐng) 别(bié) 百里(bǎilǐ)  【C】 蔡(cài)  岑(cén) 曹(cáo) 陈(chén) 程(chéng)  褚(chǔ) 昌(chāng) 常(cháng) 成(chéng) 崔(cuī) 储(chǔ) 车(chē) 池(chí) 从(cóng) 苍(cāng) 柴(chái) 充(chōng) 晁(cháo)     巢(cháo) 淳于(chúnyú) 单于(chányú) 楚(chǔ)   【D】 笪(dá) 戴(dài) 狄(dí) 窦(dòu) 东(dōng) 董(dǒng) 杜(dù) 刁(diāo) 丁(dīng) 邓(dèng) 段(duàn) 党(dǎng) 堵(dǔ) 都(dū) 东方(dōngfāng) 端木(duānmù) 段干(duàngān)  东郭(dōngguō) 东门(dōngmén) 第五(dìwǔ)  【E】 鄂(è)  【F】  法(fǎ) 费(fèi) 范(fàn) 樊(fán) 方(fāng) 房(fáng) 丰(fēng) 封(fēng) 酆(fēng) 冯(féng) 费(fèi) 房(fáng) 傅(fù) 伏(fú) 符(fú) 福(fú) 扶(fú) 富(fù)  【G】 盖(gài) 甘(gān) 干(gān) 高(gāo) 郜(gào) 戈(gē) 葛(gě) 耿(gěng) 谷(gǔ) 古(gǔ) 顾(gù) 郭(guō) 国(guó) 归(guī) 桂(guì) 勾(gōu) 缑(gōu) 关(guān) 管(guǎn) 广(guǎng)     公(gōng)  弓(gōng)  龚(gōng) 宫(gōng) 巩(gǒng) 贡(gòng) 公孙(gōngsūn)  公西(gōngxī) 公羊(gōngyáng) 公冶(gōngyě) 公良(gōngliáng) 榖梁(gǔliáng)     【H】  哈(hǎ) 海(hǎi) 郝(hǎo) 韩(hán) 杭(háng) 何(hé) 和(hé) 贺(hè) 衡(héng) 花(huā)    滑(huá) 桓(huán) 怀(huái) 胡(hú) 扈(hù)    惠(huì) 华(huà) 宦(huàn) 黄(huáng)   侯(hóu) 后(hòu) 洪(hóng) 弘(hóng) 红(hóng) 霍(huò) 赫连(hèlián) 皇甫(huángpǔ)  呼延(hūyán)  【J】  嵇(jī) 姬(jī) 吉(jí) 汲(jí) 籍(jí) 季(jì) 计(jì) 纪(jì) 蓟(jì) 冀(jì) 暨(jì) 金(jīn) 靳(jìn) 家(jiā) 郏(jiá) 贾(jiǎ) 简(jiǎn) 焦(jiāo)   姜(jiāng) 江(jiāng) 蒋(jiǎng) 晋(jìn) 经(jīng) 荆(jīng) 井(jǐng) 景(jǐng) 鞠(jū) 居(jū) 夹谷(jiágǔ)  【K】 寇(kòu) 孔(kǒng) 康(kāng) 柯(kē) 蒯(kuǎi) 隗(kuí) 夔(kuí) 匡(kuāng) 阚(kàn)     空(kōng) 亢(kàng) 况(kuàng)  【L】  李(lǐ) 郎(láng) 鲁(lǔ) 柳(liǔ) 雷(léi) 蓝(lán) 路(lù) 娄(lóu)   林(lín) 栾(luán) 厉(lì) 刘(liú) 柳(liǔ) 黎(lí) 吕(lǚ) 梁(liáng) 廉(lián) 鲁(lǔ) 骆(luò) 罗(luó) 凌(líng) 卢(lú)   陆(lù) 栾(luán) 龙(lóng) 赖(lài) 劳(láo) 郦(lì) 蔺(lìn) 连(lián) 廖(liào) 禄(lù) 利(lì)  隆(lóng) 冷(lěng) 逯(lù) 令狐(lìnghú) 闾丘(lǘqiū) 梁丘(liángqiū)  【M】  马(mǎ) 满(mǎn) 苗(miáo) 母(mǔ) 穆(mù) 毛(máo) 明(míng)  茅(máo) 麻(má)     蒙(méng)  孟(mèng) 糜(mí) 米(mǐ) 宓(mì)  梅(méi) 莫(mò) 墨(mò) 牟(móu) 缪(miào) 牧(mù) 慕(mù) 闵(mǐn) 俟(mòqí) 慕容(mùróng)  【N】  那(nā) 能(nài) 佴(nài) 倪(ní) 年(nián) 宁(nìng) 乜(niè) 聂(niè) 钮(niǔ) 牛(niú)     
    百家姓全文(按拼音排序)  农(nóng) 南门(nánmén) 南宫(nángōng)    【O】  欧(ōu) 欧阳(ōuyáng)  【P】  潘(pān) 庞(páng) 逄(páng) 裴(péi) 彭(péng) 蓬(péng) 皮(pí)  平(píng) 蒲(pú) 濮(pú) 浦(pǔ) 濮阳(púyáng)  【Q】  戚(qī) 齐(qí) 祁(qí) 乔(qiáo) 谯(qiáo) 强(qiáng) 屈(qū) 璩(qú) 瞿(qú) 钱(qián) 秦(qín) 钦(qīn) 琴(qín) 权(quán) 亓官(qínguān) 漆雕(qīdiāo) 邱(qiū) 秋(qiū) 裘(qiú) 仇(qiú) 曲(qū) 全(quán) 阙(quē)  【R】   冉(rǎn) 饶(ráo) 壤驷(rǎngsì) 任(rèn) 阮(ruǎn) 荣(róng) 容(róng) 芮(ruì) 戎(róng)  融(róng) 茹(rú) 汝(rǔ)  【S】  桑(sāng)  司(sī)  宋(sòng) 松(sōng) 舒(shū) 水(shuǐ) 苏(sū) 宿(sù) 孙(sūn) 索(suǒ)  沈(shěn)  沙(shā) 邵(shào) 施(shī) 师(shī) 石(shí) 史(shǐ) 时(shí) 厍(shè) 束(shù)  殳(shū)   盛(shèng)  单(shàn) 山(shān) 商(shāng) 尚(shàng) 双(shuāng) 韶(sháo)  莘(shēn)   申(shēn) 慎(shèn) 寿(shòu) 司马(sīmǎ) 上官(shàngguān) 申屠(shēntú)  司徒(sītú)   司空(sīkōng) 司寇(sīkòu) 生(shēng) 帅(shuài) 佘(shé) 赏(shǎng)  【T】 邰(tái) 谭(tán) 谈(tán) 陶(táo) 唐(táng) 汤(tāng) 滕(téng) 田(tián) 童(tóng)通(tōng) 佟(tóng) 钭(tǒu) 屠(tú) 涂(tú) 太叔(tàishū) 澹台(tántái) 拓跋(tuòbá)    【W】 万(wàn) 邬(wū) 巫(wū) 乌(wū) 吴(wú) 伍(wǔ) 武(wǔ) 汪(wāng) 王(wáng)  危(wēi) 微(wēi) 韦(wéi) 卫(wèi) 魏(wèi) 蔚(wèi) 温(wēn) 闻(wén) 文(wén) 翁(wēng) 沃(wò) 闻人(wénrén) 巫马(wūmǎ)  【X】  奚(xī) 郗(xī) 席(xí) 习(xí) 郤(xì) 夏(xià) 萧(xiāo) 咸(xián)   宣(xuān)  熊(xióng)   项(xiàng) 须(xū) 胥(xū) 徐(xú) 许(xǔ)   薛(xuē) 荀(xún) 谢(xiè) 解(xiè) 辛(xīn)    邢(xíng) 幸(xìng) )   向(xiàng) 相(xiàng) 夏侯(xiàhóu) 轩辕(xuānyuán) 鲜于(xiānyú) 西门(xīmén)  【Y】  燕(yān) 鄢(yān) 颜(yán) 言(yán) 闫(yán) 阎(yán) 严(yán)晏(yàn) 姚(yáo) 羊(yáng)  杨(yáng) 阳(yáng) 养(yǎng) 仰(yǎng) 叶(yè) 云(yún) 俞(yú) 袁(yuán) 於(yū) 于(yú) 鱼(yú) 虞(yú) 余(yú) 庾(yǔ) 禹(yǔ) 郁(yù) 喻(yù) 鬱(yù) 乐(yuè) 岳(yuè)    越(yuè) 元(yuán) 伊(yī) 易(yì) 羿(yì) 益(yì) 阴(yīn) 殷(yīn)尹(yǐn)印(yìn) 应(yīng)  尤(yóu) 游(yóu) 有(yǒu) 雍(yōng)   尉迟(yùchí) 宇文(yǔwén) 乐正(yuèzhèng) 羊舌(yángshé)  【Z】  宰(zǎi) 昝(zǎn) 查(zhā) 翟(zhái) 詹(zhān) 湛(zhàn) 张(zhāng) 章(zhāng) 赵(zhào)  訾(zǐ) 支(zhī) 甄(zhēn) 曾(zēng) 周(zhōu) 邹(zōu) 郑(zhèng) 朱(zhū) 诸(zhū) 竺(zhú) 祝(zhù) 臧(zāng)  宗(zōng) 钟(zhōng) 终(zhōng) 仲(zhòng) 祖(zǔ) 左(zuǒ) 卓(zhuó) 庄(zhuāng) 诸葛(zhūgě) 宗政(zōngzhèng) 仲孙(zhòngsūn) 钟离(zhōnglí)   长孙(zhǎngsūn) 仉督(zhǎngdū) 子车(zǐjū) 颛孙(zhuānsūn) 宰父(zǎifǔ) 左丘(zuǒqiū)
    

    通常网上找到的都是些包含音调的字符序列。我们的主要目的包括:

    1. 去掉汉字和其它与拼音无关的字符。
    2. 将音调替换成没有音节的字母。
    3. 去掉重复的拼音。
    4. 排好序,每行一个。

    假如上述文件存放在yindiao.txt中。

    (1).去掉非拼音相关的字符,只保留拼音字母,并存放到yindiao1.txt文件中。

    cat yindiao.txt | tr -s ' ' '\n' | sed -r -n "s/([^a-z])//pg" >yindiao1.txt
    

    将得到如下格式的内容:

    xíng
    xìng
    
    xiàng
    xiàng
    xiàhóu
    xuānyuán
    xiānyú
    xīmén
    
    yān
    yān
    yán
    yán
    yán
    yán
    yányàn
    yáo
    yáng
    yáng
    yáng
    

    (2).将带音节的字母替换。

    如何处理音节,可能很多人不知道,但仔细阅读过正则表达式语法说明的人想必都知道如何表示。

    在正则表达式中,使用[=a=]来表示字母a的各种音节,即āáǎà。其实这不是正则中的语法,而是一种类,它称为等价类

    常见的类集还有:

    • 字符类:如[:alpha:][:alnum:]......;
    • 排序类:如[.ab.],排序类明确表示其内字符是一个整体,例如这里的例子表示只能匹配"ab",不能匹配a或b或ba。

    回归正题,现在就可以将带有音节的字符进行替换了。

    由于26个字母,每个字母都有4个音节,光是音节字符就共有26*4=104个。所以,想要替换文件中的所有音节字符,考虑使用循环。

    for i in {a..z};do
        sed -i -r "s/[[="$i"=]]/"$i"/g" yindiao1.txt
    done
    

    如果不知道sed中的引号为什么这样用,见sed修炼系列(四):sed中的疑难杂症

    注意,这里sed必须使用"-i"选项,不能重定向,因为每次循环都只改变一个字母的音节,每次重定向到文件中显然不合适。

    至此,得到了下面没有音节的拼音。最后剩下排序和去重。

    xu
    xu
    xu
    xu
    xue
    xun
    xie
    xie
    xin
    xing
    xing
    
    xiang
    xiang
    xiahou
    

    (3).排序、去重。

    sort yindiao1.txt | uniq -u > yindiao.txt
    

    这样就得到了期待的结果。

    展开全文
  • 我们不小心按下ctrl+shift时经常会从常用的搜狗拼音输入法中切换到微软拼音输入法,所以要删掉微软拼音输入法 1.点击输入法图标,选择语言首选项 2.点击这个 3.点击选项 4.点击这个 5.点击删除 ...

    我们不小心按下ctrl+shift时经常会从常用的搜狗拼音输入法中切换到微软拼音输入法,所以要删掉微软拼音输入法
    注意:首先先切换输入法到搜狗输入法,不要使用微软拼音输入法
    1.点击输入法图标,选择语言首选项
    在这里插入图片描述
    2.点击这个
    在这里插入图片描述
    3.点击选项
    在这里插入图片描述
    4.点击这个
    在这里插入图片描述
    5.点击删除
    在这里插入图片描述
    如果还是不行,就添加一次后,再删除。

    展开全文
  • win10删除微软拼音

    2017-03-20 23:07:49
    win10的输入法设置相比win7而言有较多的改变。 按照下面几个步骤可以删除win10的微软拼音

    win10的输入法设置相比win7而言有较多的改变。

    按照下面几个步骤可以删除win10的微软拼音


    展开全文
  • XP 删除微软拼音 3.0

    2021-01-01 10:18:34
    windows xp 环境下删除微软拼音 3.0 注册表中删除 HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\MSSCIPY 这个键值。 reg delete HKCU\Software\Microsoft\Windows\CurrentVersion\MSSCIPY /a /f

    windows xp 环境下删除微软拼音 3.0

    先从 Text Services and Input Languages 中删除微软拼音 3.0

    C:\>control input.dll

    然后删除控件msimtf.dll、msctf.dll

    C:\>regsvr32 /u msimtf.dll
    C:\>regsvr32 /u msctf.dll

    再删除注册表中 HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\MSSCIPY 这个键值。

    C:\>reg delete HKCU\Software\Microsoft\Windows\CurrentVersion\MSSCIPY /a /f

     

    展开全文
  • 删除了微软拼音输入法的文件,但是注册表中的微软拼音输入法还是存在,并且由于找不到执行文件而报错,建议找别的机器把这个文件拷贝回来,然后执行下面的步骤 1点击控制版面 2选择添加删除程序 3选择office然后...
  • 彻底删除搜狗拼音

    2017-10-27 18:39:00
    已通过注册表找到目录,删除之就可以了。[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Keyboard Layouts]在Keyboard Layouts下找到相应的目录删除即可。
  • 点击开始,选择设置 在设置中选择【时间和语言】 3.左侧选择【语言】,点击正在使用的【中文(中华人民共和国)】,点击【选项】 4.点击微软拼音,点击【删除】 搞定!!!
  • 转帖: ...如何删除微软拼音输入法2003 toby 发表于 2005-3-22 23:42:00 注册表: “HKEY_USERS\.DEFAULT\Software\Microsft\Windows\currentVersion\Run”,看到一个键值名为ctfmon.exe,值为ctfm...
  • 删除WINDOWS10中讨厌的微软拼音

    千次阅读 2017-12-13 21:42:40
    在网上找了好久,都没有找到好的办法,删除WINDOWS10中的微软拼音。 自己摸索了一个小时,终于搞定了。 打开注册表,找到:  HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\CTF\TIP 删除 {81d4e9c9-1d3b-41bc-9e6c-...
  • 如何删除微软拼音输入法2007

    千次阅读 2015-09-29 18:17:23
    微软拼音输入法2007非常顽固,找了很多方法,最终一下方法奏效,以此mark MsiExec.exe /X{90120000-0028-0804-0000-0000000FF1CE} 之后会提示是否删除该软件,点击是即可
  • “添加或删除程序”-“Microsoft Office Professional Edition 2003”-“更改”-“添加或删除功能”-“选择应用程序的高级自定义”-“下一步”-“Office 共享功能”-“中文可选用户输入方式”-右击“微软拼音输入法...
  • 如何删除输入法:微软拼音

    千次阅读 2019-01-30 19:22:31
    1、右击菜单栏“输入法”,点击里面“设置”; 2、点击“区域和语言”中的“添加语言” “A字”; 3、点击“A字”中“选项”; 4、点击微软拼音,选择删除。...
  • [转载]删除微软拼音输入法

    千次阅读 2011-09-17 00:33:13
    删除微软拼音输入法 微软拼音输入法,已经被搜狗拼音淘汰了,但是 微软拼音2007 其字库占用了不少空间: C:\Documents and Settings\All Users\Application Data\Microsoft\IMSC12文件夹会占用100多M空间。
  • Win7系统删除微软拼音

    2013-08-13 10:31:00
    微软拼音会在使用Office时偷偷的安装,都找不到删除的地方。在网上找了很多方法都不灵光,最后用下面的方法成功删除。   在语言设置窗口里,重新添加一次这个输入法,确定保存,然后再删除,就行了。 这个输入法...
  • 彻底删除微软拼音输入法2003 用普通的输入法属性删除法是不能够删除的,下次开机又自动添加回来。 下面这个方法可以很干净彻底的使微软拼音输入法不再审之疲劳了: 运行以下命令: Regsvr32 /U Msimtf.dll ...
  • 删除微软拼音输入法

    千次阅读 2006-10-08 12:42:00
    注册表:“HKEY_USERS/.DEFAULT/Software/Microsft/Windows/currentVersion/Run”,看到一个键值名为ctfmon.exe,值为ctfmon.exe。...3.在控制面板里,双击添加/删除程序。4.在当前安装程序列表里,选
  • 打开后把内容复制下来,粘贴到cmd中,回车即可。能完全删除
  • 最近安装完office组件后系统默认的输入法变成了微软的中文输入法,非常恶心,下面说一下win7删除的方法 在---------------------语言栏右键 ---------------------选设置----------------常规-------------------...
  • 1:使用第三方输入法自带的输入法管理器可以删掉,例如“搜狗拼音输入法”,就可以去掉微软拼音 因为搜狗输入法有两个模式,Metro模式和普通模式,似乎安装搜狗后可以在系统直接删掉微软拼音 2:利用系统的一点小...
  • 所以,先用如下命令: 在 开始 〉运行 中输入(或复制) MsiExec.exe /X{90120000-0028-0804-0000-0000000FF1CE} 最后语言里出现拼音输入法2007的选项,删除即可。 windows7下任务栏的语言设置里没有“拼音...
  • Mac中彻底删除搜狗拼音输入法一法

    千次阅读 2019-10-01 17:17:52
    搜狗挺流氓,不知什么时候就在系统中添加了搜狗拼音输入法。本来一直用搜狗五笔,感觉挺好,这一来好印象全没了。 试过一些方法都不行。 最后试了下面的方法,证实可行。 # rm -rf /Library/Input\ Methods/...
  • ... 第三步:在弹出的窗口中,选择微软拼音,点击【删除】即可。 删除后的效果如下 结束语 如果这篇博客有幸帮到了您,欢迎点击下方链接,和更多志同道合的伙伴一起交流,一起进步。 ...
  • 彻底删除微软拼音输入法的方法

    千次阅读 2008-05-17 13:31:00
    问:如何彻底删除微软拼音输入法,TMD好讨厌啊~~每次删除了会自动回来~~答: 开始菜单>运行:Regsvr32 /U Msimtf.dllRegsvr32 /U Msctf.dll开始菜单>运行:regedit把注册表中 HKEY_CURRENT_USER/Software/...
  • 易语言QQ拼音输入法导入源码,QQ拼音输入法导入,删除中间文本
  • 目标 :在 Ubuntu 13.04以及基于Ubuntu的发行版上安装fcitx小企鹅输入法,并安装Linux版本搜狗输入法。 方法 : 提供两种输入法,一种添加...于是删除该项,然后Ctrl+Space就可以切换到Fcitx了。。。
  • 1. 控制面板 2.更换输入法 选择添加语言 ...然后删除中文输入法即可 需要在英文的语言栏里面添加-选项-增加输入法 然后删除中文即可. 转载于:https://www.cnblogs.com/jinanxiaolaohu/p/8605881.html...
  • 不纠结,直接上图如果这里的删除键是灰色的,那表明这是最后一个输入法,需要再添加其他输入法才能删这个,点击图3的添加键盘,比如QQ拼音,之后删除微软拼音就行了...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 28,343
精华内容 11,337
关键字:

删除拼音