精华内容
下载资源
问答
  • linux 修改文件编码格式
    千次阅读
    2020-03-09 10:32:26

    set encoding=utf-8

    更多相关内容
  • Linux下批量修改文件编码
  • linux 查看文件编码

    2019-03-20 04:03:35
    NULL 博文链接:https://xieye.iteye.com/blog/849907
  • Linux文件编码的查看和修改都有不止一种做法,如果你需要在Linux中操作windows下的文件,那么很可能会经常遇到文件编码转换的问题,如何进行这项工作,也应该是经常工作在双系统下的操作者的必须掌握的知识。...

    Linux文件编码的查看和修改都有不止一种做法,如果你需要在Linux中操作windows下的文件,那么很可能会经常遇到文件编码转换的问题,如何进行这项工作,也应该是经常工作在双系统下的操作者的必须掌握的知识。

    Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8。下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换。

    查看文件编码

    在Linux中查看文件编码可以通过以下几种方式:

    1.在Vim中可以直接查看文件编码

    :set fileencoding

    即可显示文件编码格式。

    如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在

    ~/.vimrc 文件中添加以下内容:

    set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

    这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。

    2. enca (如果你的系统中没有安装这个命令,可以用sudo yum install -y enca 安装 )查看文件编码

    $ enca filename

    filename: Universal transformation format 8 bits; UTF-8

    CRLF line terminators

    需要说明一点的是,enca对某些GBK编码的文件识别的不是很好,识别时会出现:

    Unrecognized encoding

    文件编码转换

    1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式

    :set fileencoding=utf-8

    2. enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,操作如下

    enconv -L zh_CN -x UTF-8 filename

    3. iconv 转换,iconv的命令格式如下:

    iconv -f encoding -t encoding inputfile

    比如将一个UTF-8 编码的文件转换成GBK编码

    iconv -f GBK -t UTF-8 file1 -o file2

    Linux文件编码的查看和修改也就是这个简单的工作了。

    【责任编辑:仲衡 TEL:(010)68476606】

    点赞 0

    展开全文
  • 若是你须要在Linux中操做windows下的文件,那么你可能会常常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux通常都是UTF-8。下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件...

    若是你须要在Linux中操做windows下的文件,那么你可能会常常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux通常都是UTF-8。下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换。java

    查看文件编码python

    在Linux中查看文件编码能够经过如下几种方式:linux

    1.在Vim中能够直接查看文件编码vim

    :set fileencodingwindows

    便可显示文件编码格式。工具

    若是你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你能够在google

    ~/.vimrc 文件中添加如下内容:编码

    set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936spa

    这样,就可让vim自动识别文件编码(能够自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,若是没有找到合适的编码,就用latin-1(ASCII)编码打开。code

    文件编码转换

    1.在Vim中直接进行转换文件编码,好比将一个文件转换成utf-8格式

    :set fileencoding=utf-8

    2. iconv 转换,iconv的命令格式以下:

    iconv -f encoding -t encoding inputfile

    好比将一个UTF-8 编码的文件转换成GBK编码

    iconv -f GBK -t UTF-8 file1 -o file2

    Linux对一个3G的文本进行编码转换全过程

    本过程当中涉及到的Linux的命令有:split, iconv, cat

    问题:有一个3G的文本a.txt,编码格式为gbk,如今须要对其进行转换成为utf-8。

    难点:iconv的转换是在内存中进行的,所以3G大小的文本,没法进行直接转换。

    思路:先利用split进行文件切分,而后对每个字文件进行ivonv转换,最后进行cat合并。

    1) ll -h a.txt 查看文件的大小,2.9G

    2) wc -l a.txt 查看文件的行数,9千200万行

    3) split -l 20000000 a.txt chunk 按照每一个文件2千万行进行切割,共分红5个文件

    4) 进行转换

    iconv -f gbk -t utf-8 chunka > chunka_utf8 -c

    iconv -f gbk -t utf-8 chunkb > chunkb_utf8 -c

    iconv -f gbk -t utf-8 chunkc > chunkc_utf8 -c

    iconv -f gbk -t utf-8 chunkd > chunkd_utf8 -c

    iconv -f gbk -t utf-8 chunke > chunke_utf8 -c

    5) rm chunka chunkb chunkc chunkd chunke 删除原文件

    6) cat chunk* > a.txt_utf8 进行合并

    至此,工做完成

    2、

    批量文件编码转换

    本操做有风险,请注意操做前备份文件。

    1.将原来全部编码为gb2312的*.java文件转换为编码为utf-8的*.java.new文件

    for i in `find . -name "*.java"`; do iconv -f gb2312 -t utf-8 $i -o $i.new; done

    2.将*.java.new文件的.new扩展名去除

    find . -name "*.new" | sed 's/\(.*\).new$/mv "&" "\1"/' | sh

    3、

    linux下有许多方便的小工具来转换编码,

    文本内容转换   iconv

    文件名转换     convmv

    mp3标签转换    python-mutagen

    4、

    用法: iconv [选项...] [文件...]

    转换给定文件的编码。

    输入/输出格式规范:

    -f, --from-code=名称      原始文本编码

    -t, --to-code=名称         输出编码

    信息:

    -l, --list                     列举全部已知的字符集

    输出控制:

    -c                             从输出中忽略无效的字符

    -o, --output=FILE    输出文件

    -s, --silent               关闭警告

    --verbose            打印进度信息

    -?, --help                 给出该系统求助列表

    --usage               给出简要的用法信息

    -V, --version            打印程序版本号

    5、

    find default -type d -exec mkdir -p utf/{} \;

    find default -type f -exec iconv -f GBK -t UTF-8 {} -o utf/{} \;

    这两行命令将default目录下的文件由GBK编码转换为UTF-8编码,目录结构不变,转码后的文件保存在utf/default目录下。

    6、

    Linux下文件名编码批量转换convmv

    因为FC将字符编码统一成了UTF8,原来在gb18030下创建的ext3分区中的文件和目录,一挂载到FC上就显示成乱码。google遍整个互联网,说对于目录名和文件名,有一个叫convmv的软件能够对其进行自动转换。

    今日下载了convmv,摸索了一套使用方法以下:

    convmv -f code1 -t code2 -r

    code1:分区原来使用的字符集编码。支持gb23十二、gbk、big5,不支持gb18030和big5-hkscs。

    code2:预转换到的字符集编码。对于FC,这里填写utf8

    -r 参数:转换子目录。

    dir:要转换的目录,当前目录用./表示。

    回车执行,这个时候convmv会显示执行的结果,但不会真正对文件进行修改。并提示使用--replace参数进行修改。

    7、

    批量转换文件的编码

    for i in `find ./ -name *.htm` ; do echo $i;iconv -f gb18030 -t utf8 $i -o /tmp/iconv.tmp;mv /tmp/iconv.tmp $i; done

    find -name “*.htm“ \

    -exec iconv -f gb2312 -t utf8 ‘{}‘ -o /tmp/iconv.tmp \; \

    -exec mv /tmp/iconv.tmp ‘{}‘ \;

    展开全文
  • Linux修改文件编码格式的三种方式

    千次阅读 2021-11-12 11:02:57
    查看文件编码格式如下,将文件格式修改为UTF-8 >file demo.txt >demo.txt: ISO-8859 text >vim demo.txt >:set fileencoding #显示 fileencoding=latin1 设置编码格式为utf-8 :setlocal ...

    查看文件编码格式如下,将文件格式修改为UTF-8

     >file demo.txt
     >demo.txt: ISO-8859 text
    
    >vim demo.txt
    >:set fileencoding
     #显示
     fileencoding=latin1
    

    设置编码格式为utf-8

     :setlocal buftype=
     :set fileencoding=utf-8
     :wq! 
    

    在查看编码格式:

    >:set fileencoding
     #显示
     fileencoding=utf-8
    

    2.iconv转换编码
    iconv -c -f latin1 -t utf-8 demo.txt > demo.txt
    3.修改编码格式一般是为了解决中文乱码的问题。可以修改终端编码与文件编码一致。
    查看编码格式:
    在这里插入图片描述
    修改:
    export LC_ALL=en_US.iso88591
    当然修改终端编码还可以在 /etc/profile 设置。
    如有错误,还望不吝指正,谢谢。

    展开全文
  • Linux修改文件编码

    千次阅读 2020-03-18 16:13:41
    Linux中查看文件编码可以通过以下几种方式: 1.在Vim中可以直接查看文件编码 :set fileencoding 即可显示文件编码格式。 如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在 ~/...
  • 在将windows上的jsp网页移植到linux环境中时,发现一个个的转换编码修改默认编码类型太慢,写此脚本进行尝试文件遍历~ 好久不写,手生了。 代码如下: #!/bin/bash # # SPATH=”/root/chengji/WebRoot” DPATH=”/...
  • Linux修改文件编码

    2017-10-18 15:23:00
    enca -L zh_CN -x UTF-8 {filename} 转载于:https://www.cnblogs.com/mkxzy/p/7686863.html
  • 问题:在我的 Linux 系统中有一个编码为 iso-8859-1 的字幕文件,其中部分字符无法正常显示,我想把文本改为 utf8 编码。在 Linux 中, 有没有一个好的工具来转换文本文件的字符编码?正如我们所知道的那样,电脑只...
  • Linux修改文件编码格式 使用vi或者vim进入到文件内 查看当前文件的编码格式,这里格式为latin1 输入:,然后输入set fileencoding命令,回车 修改格式为utf-8 输入命令(:set fileencoding = utf-8) = utf-8)...
  • 2015-02-10 回答有什么办法可以让source insight支持utf-8编码的源代码文件吗?找到si官网的解释:source insight 3.x frequently asked questionsq: does source insight support unicode files?a: source insight ...
  • Linux查看文件编码格式及文件编码转换在Linux 中专门提供了一种工具convmv进行文件 名 编码 的转换 ,可以将文件 名 从GBK转换 成UTF-8编码 ,或者从UTF-8转换 到GBK。首先看一下你的系统上是否安装了convmv,如果没...
  • 查看文件编码file命令file ip.txt查看文件编码file命令file ip.txtip.txt: UTF-8 Unicode text, with escape sequences一、利用iconv命令进行编码转换文件内容编码转换iconv命令用于转换指定文件的编码,默认输出到...
  • Linux中查看文件编码修改文件编码

    千次阅读 2019-08-04 01:12:05
    最近遇到一个需求,给我两个大文件,映射到Hive表中。 文件中每个字段的值都有"",字段分隔符为’,’ ,通过vi查看文件内容正常,没有出现乱码。 首先想到的方法是在hive中创建对应的表,然后通过put,将文件上传到...
  • linux下查看文件编码修改编码

    千次阅读 2021-05-15 23:23:38
    通常来说,Windows中默认的文件格式是GBK(gb2312),...vim中查询修改文件编码格式set fileencoding查看现在文本的编码:set fenc=编码转换当前文本的编码为指定的编码:set enc=编码以指定的编码显示文本,但不保存到...
  • 参考连接
  • linux下查看文件编码

    2022-04-19 16:27:04
    1、查看当前目录下所有文件编码: find . -name '*' | xargs file 2、更换文件编码: iconv -f 源编码 -t 目标编码 原文件名 -o 输出文件名 # 例如:将a.txt从UTF-8编码改为GBK编码 iconv -f UTF-8 -t GBK a...
  • 修改文件编码格式 需求:将一个文件转换成UTF-8格式。(原来是GBK格式)。 法1:vim 1.打开文件 vim filename 2.设置编码格式 :set fileencoding=utf-8 法2:iconv iconv -f gbk -t utf8 inputFile.txt -...
  • 1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 :set fileencoding=utf-8 enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,操作如下 enconv -L zh_CN -x UTF-8 filename iconv ...
  • 将使用gb18030编码文件file1.txt转换为utf-8编码文件file2.txt: iconv -f gb18030 -t utf-8 file1.txt -o file2.txt 但是这个命令不好使,一方面容易重复转换,另一方面不支持通配符,无法成批转换,还有如果...
  • centos6系统修改编码[root@localhost scripts]# vim /etc/sysconfig/i18nLANG="zh_CN.GB2312"SUPPORTED="zh_CN.UTF-8:zh_CN:zh"SYSFONT="latarcyrheb-sun16"[root@localhost scripts]# source /etc/sysconfig/i18n...
  • 使用python的chardet库获得文件编码修改编码windows和linux采用了不同的编码,这让很多人伤透了脑经,这里我采用了Python的chardet库获得代码的编码,然后修改编码首先需要安装chardet库,有很多方式,我才用的是...
  • 假如你须要在Linux中操作windows下的文件,那么你可能会时常遇到文件编码转换的疑问。Windows中默认的文件格式是GBK(gb2312),而Linux通常都是UTF-8。下面推选一下,在Linux中如何查看文件的编码及如何实行对文件...
  • 使用方法:./fconv type1 type2 dir 含义:from 'type1' to 'type2' in directory 'dir'
  • 想要把ASCII编码格式的文件转成UTF-8格式编码文件,但是尝试了网上说的几种方式,均无法实现,不知道有哪里没做对? ``` # vim打开文件后,直接设置编码格式 :set fileencoding=utf-8 # iconv工具转换 ...
  • 背景 项目工程文件编码格式有utf-8,也有gb2312,在通过Source Insight 4.0打开文件只能设置一种默认编码格式UTF-8/Windows ANSI/GB2312,不能自动识别文件本身的编码格式...enca是Linux下的文件编码转换工具。 e...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 184,903
精华内容 73,961
关键字:

修改linux文件编码