精华内容
下载资源
问答
  • 当存在多语言时,需要将简体中文转换成繁体linux 系统 可以安装opencc安装命令: sudo apt-get install opencc命令中参数内容:s2t.json Simplified Chinese to Traditional Chinese 簡體到繁體t2s.json ...

    当存在多语言时,需要将简体中文转换成繁体时

    linux 系统 可以安装opencc

    安装命令: sudo apt-get install opencc

    命令中参数内容:

    s2t.json Simplified Chinese to Traditional Chinese 簡體到繁體

    t2s.json Traditional Chinese to Simplified Chinese 繁體到簡體

    s2tw.json Simplified Chinese to Traditional Chinese (Taiwan Standard) 簡體到臺灣正體

    tw2s.json Traditional Chinese (Taiwan Standard) to Simplified Chinese 臺灣正體到簡體

    s2hk.json Simplified Chinese to Traditional Chinese (Hong Kong Standard) 簡體到香港繁體(香港小學學習字詞表標準)

    hk2s.json Traditional Chinese (Hong Kong Standard) to Simplified Chinese 香港繁體(香港小學學習字詞表標準)到簡體

    s2twp.json Simplified Chinese to Traditional Chinese (Taiwan Standard) with Taiwanese idiom 簡體到繁體(臺灣正體標準)並轉換為臺灣常用詞彙

    tw2sp.json Traditional Chinese (Taiwan Standard) to Simplified Chinese with Mainland Chinese idiom 繁體(臺灣正體標準)到簡體並轉換為中國大陸常用詞彙

    t2tw.json Traditional Chinese (OpenCC Standard) to Taiwan Standard 繁體(OpenCC 標準)到臺灣正體

    t2hk.json Tropencc -i wiki.zh.text -o wiki.zh.text.jian -c s2t.json

    aditional Chinese (OpenCC Standard) to Hong Kong Standard 繁體(OpenCC 標準)到香港繁體(香港小學學習字詞表標準)

    ---

    安装完成后调试命令

    opencc -i input.simple.file -o output.traditional.file -c s2t.json

    命令中file 都是参数, s2t.json也是参数,选择转换的类型。

    标签:linux2,Chinese,繁体,Standard,Traditional,json,Simplified,繁體,简体中文

    来源: https://www.cnblogs.com/ljymoonlight/p/14743000.html

    展开全文
  • 转载自: http://hi.baidu.com/runningon/item/7acd387eddb5aa346cc37ce4Linux下在程序中如何进行繁体中文和简体中文的转换首先发个牢骚吧,简繁转换的问题让我在网上搜了好久都没有好的答案,得到的回答尽是让我建个...

    转载自: http://hi.baidu.com/runningon/item/7acd387eddb5aa346cc37ce4

    Linux下在程序中如何进行繁体中文和简体中文的转换

    首先发个牢骚吧,简繁转换的问题让我在网上搜了好久都没有好的答案,得到的回答尽是让我建个简繁体字的对照表然后自己查表。我就不信了,这都什么年代了,这么常规的功能还要自己造轮子。果然工夫不负苦心人,轮子终于让我找到了,名叫opencc,ibus-pinyin里的繁体部分使用了它,项目主页地址:

    http://code.google.com/p/opencc/

    不过opencc没有一个简单的教程挺让我抓狂,自己看它的源代码才搞清楚怎么弄,为造福各位和我一样为简繁转换苦恼了很久的童鞋,本人献上这篇文章,欢迎转载,转载请注明作者RunningOn。

    在献上教程之前,提醒下面两类童鞋可以不用看本文:

    1. 写Windows程序的人。Windows自己提供了LCMapString API可以做简繁转换,搜它就行了,网上例程也多。

    2. 用python的人。python下我使用过两个包,一个是jianfan,简单直观,但有bug,有些常用的字都不能转换,推荐度一般。另外一个是opencc的python绑定,主页在http://pypi.python.org/pypi/opencc-python/,网页下方有win和linux的安装包,而且网页里有教程。看不懂英文?我了个擦,那网页里面才几个单词......

    本文的重点是Linux下用C语言如何进行简繁转换。以Ubuntu 11.10为例吧,其它发行版应该大同小异。你还需要知道一些文字编码的基础知识。

    关于编码的知识这里不打算详细介绍,但你需要知道:中文中常用的编码有gb2312, gbk, gb18030, big5, utf8和unicode。严格来讲gb18030和utf8只是unicode的编码方式,但本文中简单起见把它们认为是不同的编码,想搞清楚编码关系的自己去搜吧,资料很多。

    gb2312只含简体字,big5只含繁体字,其它几种编码都同时有简体和繁体字,gb2312可以简单认为是gbk的简体子集。一般来讲简繁转换同时包含了编码的转换,比如香港地区普遍使用big5编码,转为简体字就要先转化为gbk, gb18030, utf8编码中的一种再将繁体转化为简体。

    opencc只是一个简繁转换的库,要转换编码我们还需要一个有名的库iconv。这两库的安装方法:

    sudo apt-get install libiconv-hook-dev libopencc-dev

    libopencc-dev没有提供rpm的包,也没有提供只含库的源码,所以最方便的还是apt-get。

    iconv的教程还是有不少的,这里就不做太多介绍了。但注意不是所有编码都能自由转换的,比如如果你是想把big5直接转为gb2312是不行的。

    简繁转换的通用思路是先将编码转换为utf8,再在utf8下进行简繁转换,再将utf8转为想要的编码(如果需要)。不多说,直接上代码,该解释的都写到注释里了:

    #include

    #include

    #include

    #include

    #include

    ///使用iconv库将字符串从编码from_charset转换到to_charset,输入是inbuf,输出是outbuf

    void m_iconv(const char *from_charset, const char * to_charset,

    const char *inbuf, size_t inlen, char *outbuf, size_t outlen)

    {

    memset(outbuf,0,outlen);

    iconv_t cd;

    cd = iconv_open(to_charset,from_charset);

    if (cd==0) return;

    iconv(cd, (char **)&inbuf, &inlen, &outbuf, &outlen);

    iconv_close(cd);

    }

    ///繁体转化为简体,编码从src_charset转换为dest_charset,输入是src,输出是dest

    void cht2chs(const char* src_charset, const char * dest_charset,

    const char *src, char *dest)

    {

    char utf8[1000], tempout[1000], *raw=(char *)src;

    m_iconv(src_charset, "utf8", raw, strlen(raw), utf8, sizeof(utf8));    //先转为utf8

    opencc_t od = opencc_open(OPENCC_DEFAULT_CONFIG_TRAD_TO_SIMP);

    char * chsutf8 = opencc_convert_utf8(od, utf8, strlen(utf8));    //简繁转换

    strcpy(tempout, chsutf8);

    free(chsutf8);    //一定要free不然会内存泄漏

    opencc_close(od);

    size_t len = strlen(tempout);

    m_iconv("utf8", dest_charset, tempout, len, dest, len*2+1);    //再转到目标编码

    }

    ///简体转化为繁体,编码从src_charset转换为dest_charset,输入是src,输出是dest

    void chs2cht(const char* src_charset, const char * dest_charset,

    const char *src, char *dest)

    {

    char utf8[1000], tempout[1000], *raw=(char *)src;

    m_iconv(src_charset, "utf8", raw, strlen(raw), utf8, sizeof(utf8));    //先转为utf8

    opencc_t od = opencc_open(OPENCC_DEFAULT_CONFIG_SIMP_TO_TRAD);

    char * chsutf8 = opencc_convert_utf8(od, utf8, strlen(utf8));    //简繁转换

    strcpy(tempout, chsutf8);

    free(chsutf8);    //一定要free不然会内存泄漏

    opencc_close(od);

    size_t len = strlen(tempout);

    m_iconv("utf8", dest_charset, tempout, len, dest, len*2+1);    //再转到目标编码

    }

    int main()    //main里放测试代码

    {

    char src[] = "\264\372\270\325", dest[100];    //big5编码的繁体的"测试"

    cht2chs("big5", "utf8", src, dest);    //根据实际情况,把"utf8"改为你的locale

    printf("%s\n", dest);    //输出"测试"

    return 0;

    }

    将以上代码保存到test.c,可以根据实际情况将main函数第二行的utf8改为你的locale。

    编译方法:

    gcc -o test test.c -lopencc -liconv_hook

    运行:

    ./test

    然后就可以看到输出两个简体字"测试"。

    把m_iconv, cht2chs和chs2cht这三个函数复制到你的代码里就可以直接使用了。

    最后再说明一下,opencc算是所有简繁转换库中做得很不错的了,能处理异体字,还能对一简对多繁和一繁对多简的情况自动处理。之前有一个简繁转换的cconv项目就做得不太好,而且它用GPL协议,对开发者限制太多。而opencc使用Apache开源协议,很宽松。opencc项目很赞,可惜作者在教程上没花什么功夫,所以很长时间都没有在网上看到谁使用它。如果opencc作者看到此文请写个官方的教程吧,或者把本文直接链过去:)

    展开全文
  • Linux简体繁体转换

    千次阅读 2015-07-16 15:24:36
    echo sth | cconv -f UTF8 -t UTF8-TW cconv -h显示帮助
    • cconv -f UTF8-CN -t UTF8-TW -o 结果文件 原文件
    • echo sth | cconv -f UTF8 -t UTF8-TW

    cconv -h显示帮助

    展开全文
  • Linux简体繁体文件的相互转换

    千次阅读 2019-02-27 14:46:30
    在ubuntu16.04上使用opencc工具进行转换 ...opencc -i 简体.txt -o 繁体.txt -c zhs2zht.ini 3.繁体 ----》 简体 opencc -i 繁体.txt -o 简体.txt -c zht2zhs.ini 注: 1.-i 后是需要的文件 -...

    在ubuntu16.04上使用opencc工具进行转换

    1.安装

    sudo apt-get install opencc

    2.简体 ----》 繁体

    opencc -i 简体.txt -o 繁体.txt -c zhs2zht.ini

    3.繁体 ----》 简体

    opencc -i 繁体.txt -o 简体.txt -c zht2zhs.ini

    注:

    1.-i 后是需要转的文件  -o后是转换后的文件名 

    2.-c后是转换的规则,为固定写法

    3.简体中文是Simplified Chinese /繁体中文是 Traditional Chinese

    展开全文
  • linux文本格式转换How to convert between Simplified Chinese and Traditional Chinese ... 如何通过命令行在Linux上的文本文件中的简体中文和繁体中文字符之间进行转换? You can use opencc to convert...
  • 依赖:yum install doxygen最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了。这时候就知道OpenCC的强大了。哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,...
  • 最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了。这时候就知道OpenCC的强大了。哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编译opencc时遇到了各种错误。...
  • 批量文件名改名,且可以文件名简繁转换。
  • 此文章自他人,只是...Linux下在程序中如何进行繁体中文和简体中文的转换   首先发个牢骚吧,简繁转换的问题让我在网上搜了好久都没有好的答案,得到的回答尽是让我建个简繁体字的对照表然后自己查表。我就不信
  • 怎样把所有文件的编码都转换成简体字,或者怎样将所有文件的编码变成繁体字编码,或者怎样将所有的文件都转换成 UTF-8 编码呢?下面的这段程序将告诉你去怎样实现这个功能。   # ! / bin / bash # 文件名 ...
  • linux简体繁体互换

    2018-10-30 18:58:03
    快捷键 :Ctrl + shift + f
  • linux中文简繁体转换

    千次阅读 2014-12-10 18:27:34
    前言 本文探讨如何进行中文的简体繁体之间的转换,其中方法涉及到linux中的工具,但思路不局限于linux。 目的 给出一个简体字符,输入繁体字符 1.iconv iconv的转换只能是“小到大”的,即只能把两个字符集的公共...
  • 最好,再Linux系统下操作,我使用的是macOS系统,大约处理31分钟处理完得到 wiki.zh.txt。使用windows操作时直接导致死机。Linux下执行:下载下来的压缩包不用解压,直接执行下面的命令行就可以。 D:\PyRoot\...
  • 零基础linux学习资料 鸟哥的linux私房菜 简体+繁体 基础篇+服务器篇
  • ·计算机教育·· 本栏目贲任编辑:主力中文繁简转换及其转换工具冯 霞(北京师范大学中文信息处理研究所,北京100875)摘要:简体中文和繁体中文是现代汉语并存的两种书面形式。它们在语音、词汇、语法等方面都有明显...
  • 繁体简体互相转换

    千次阅读 2018-07-08 23:04:11
    繁体简体的转换,目前常用的工具包是opencc。通过上网搜索与研究测试。目前有两种方式进行转换,一种是python调用opencc的形式,一种是linux内直接命令行操作。通过两种方式的测评,python下运行速度极慢,linux下...
  • 繁体转简体 转自 python的繁体简体转换 最好用的一个了,效果还佳 # 安装 # pip install opencc-python-reimplemented # t2s - 繁体转简体(Traditional Chinese to Simplified Chinese) # s2t - 简体转繁体...
  • 最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了。这时候就知道OpenCC的强大了。哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编译opencc时遇到了各种错误。...
  • windows使用opencc中文简体繁体

    千次阅读 多人点赞 2018-07-30 19:45:20
    OpenCC是一款开源的中文处理工具,支持字符级别的转换,可以在中文简体繁体以及香港、台湾之间相互转换。git上提供了在Debian、Ubuntu、Fedora、Arch Linux、Mac OS以及Node.js的安装方法,并没有提供在windows...
  • java调用opencc进行中文简体繁体转换

    千次阅读 2017-01-05 14:33:31
    ubuntu安装opencc,简体转繁体 opencc安装后编写shell脚本 #!/bin/sh #echo $1 echo $1 |opencc -c s2tw 测试: ubuntu@ubuntu-vm:/usr/local$ ./s2tw.sh 微儿博客www.weare.net.cn 微兒...
  • ubuntu安装opencc,简体转繁体 opencc安装后编写shell脚本 #!/bin/sh #echo $1 echo $1 |opencc -c s2tw   测试: ubuntu@ubuntu-vm:/usr/local$ ./s2tw.sh 微儿博客www.weare.net.cn 微兒博客...
  • 繁体字通常采用BIG5编码,简体字通常采用GBK或者GB18030编码,这种情况下,直接使用iconv(linux下有对应的命令,也有对应的C API供编程调用)就行。对于默认采用utf-8编码的文件或者繁简体都并存的情况(通常采用...
  • 繁体简体转换的4中方法

    千次阅读 2009-01-15 17:22:00
    譬如“國”在简体码表库中的编码是$87F8,那么根据码表查出其Unicode码是$570B,然后根据Unicode码$570B到繁体码表库中查到繁体内码是 $B0EA,问题就解决了,这个码表库可以到ftp://ftp.unicode.org/Public/...
  • 汉字简体繁体转换|GB国标码|Big5码

    千次阅读 2013-11-14 18:02:11
    汉字简体GB国标码繁体Big5码互相转换 ←【加入收藏夹】   管理员在2009年8月13日编辑了该文章文章。 --> --> 阅读(295)
  • 描述:Linux需要用心学,需要一定的编程基础来体会其中的各种好。很多时候初学Linux都会以Windows的标准来要求Linux,这样Linux会显得很微小,但为什么还有太多人使用Linux呢、为什么还有这么...其实繁体版可能更详细。
  • OpenCC是一款专注于简繁体中文转换的开源软件,可以在windows、Linux、MacOSX 上编译。该软件除了可以把实现 简体;繁体 转换以外,还可以根据大陆、台湾、香港等地区的不同习惯把专业词汇进行转换,是目前最好的简...
  • 自:https://blog.csdn.net/sinat_29957455/article/details/81290356 ...
  • 文章目录[隐藏] 导读win10 繁体简体教程 导读在使用 win10 系统的时候,经常不经意间不知道按了什么快捷方式把输入的待选文字改为了繁體。对于习惯了中文简体的我们来说十分不方便,于是就想改回中文简体。win10 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,926
精华内容 3,170
关键字:

linux繁体转简体

linux 订阅