精华内容
下载资源
问答
  • GBK文件UTF8文件

    千次阅读 2010-07-02 17:18:00
    GBK文件UTF8文件

    在编程的世界中,文件转换是经常见的,本文介绍了如何把GBK编码的文件转换成UTF8编码的文件。

    主要利用类,为java.io.InputStreamReader和java.io.OutputStreamWriter

    方法如下:

        public static void GBKFileToUtf8File(String filename) throws IOException {
            final String shift = "GBK";
            final String utf8 = "utf-8";

            String backupfilename = filename + ".backup";
            File f = new File(filename);
            File outf = new File(backupfilename);
            f.renameTo(outf);

            java.io.FileInputStream in = new java.io.FileInputStream(backupfilename);
            java.io.InputStreamReader isr = new java.io.InputStreamReader(in, shift);
            java.io.BufferedReader br = (new java.io.BufferedReader(isr));

            // open output stream
            java.io.FileOutputStream out = new java.io.FileOutputStream(filename);
            java.io.BufferedWriter bw = new java.io.BufferedWriter(
                    new java.io.OutputStreamWriter(out, utf8));

            char[] buffer = new char[4096];
            int len;
            while ((len = br.read(buffer)) != -1)
                bw.write(buffer, 0, len);
            br.close();
            bw.flush();
            bw.close();
        }

    展开全文
  • c++ 创建Utf8 文件

    千次阅读 2016-09-06 15:29:13
    创建UTF8文件
    #include <tchar.h>
    #include <string>
    #include <fstream>
    
    std::string ToUTF8(const wchar_t* buffer, int len)  
    {  
    	int size = ::WideCharToMultiByte(CP_UTF8, 0, buffer, len, NULL, 0, NULL, NULL);  
    	if (size == 0)  
    		return "";  
    	std::string newbuffer;  
    	newbuffer.resize(size);  
    	::WideCharToMultiByte(CP_UTF8, 0, buffer, len,  
    		const_cast<char*>(newbuffer.c_str()), size, NULL, NULL);  
    
    	return newbuffer;  
    } 
    
    std::string ToUTF8(const std::wstring& str)  
    {  
        return ToUTF8(str.c_str(), (int) str.size());  
    }  
    
    int _tmain(int argc, _TCHAR* argv[])
    {
        std::ofstream test_file;  
        test_file.open("d:\\test.txt", std::ios::out | std::ios::binary);  
    
        std::wstring text =  
            L"中文字符";  
        std::string outtext = ToUTF8(text);  
    
        test_file << outtext;  
        test_file.close();  
        return 0;
    }
    
    

    展开全文
  • python写utf8文件

    千次阅读 2015-07-31 22:07:00
    需要自己确保需要的编码方式,如下例子中xxx.json为utf8格式,读入后为unicode,需要转为utf8再写文件 name='xxx.json' f=open(name,'r') of=open(name+'.txt','w') for line in f: dictdata=json.loads(line...

    【1】使用默认open方式,

    需要自己确保需要的编码方式,如下例子中xxx.json为utf8格式,读入后为unicode,需要转为utf8再写文件

    	name='xxx.json'
    	f=open(name,'r')
    	of=open(name+'.txt','w')
    	for line in f:
    		dictdata=json.loads(line)
    		out=json.dumps(dictdata,indent=4<span style="color:#3333ff;">, ensure_ascii=False</span>).encode('utf8')
    		of.write(out+'\n')
    	
    	of.close()
    对于如上json格式化的例子来说,ensure_ascii也是可以不要的。

    【2】使用codecs库

    这时候需要指定的是读入或写出的文件的编码。

    	name='xxx.json'
    	f=codecs.open(name,'r',encoding='utf8')
    	of=codecs.open(name+'.txt','w', encoding='utf8')
    	for line in f:
    		dictdata=json.loads(line)
    		out=json.dumps(dictdata,indent=4, ensure_ascii=False)
    		of.write(out+'\n')
    	
    	of.close()
    这种方式ensure_ascii貌似一定需要的了。

    展开全文
  • 场景: 1.也就只有windows需要...2.有时候需要把ansi文件内容转换为utf8编码,读取一行之后,把ansi字符串转换为utf8,之后写入文件。 #include #include #include #include #include char* Unicode2Utf8(const


    场景:

    1.也就只有windows需要那么麻烦,还搞一个ANSI编码。学学mac os x,只需要一个utf8就行。

    2.有时候需要把ansi文件内容转换为utf8编码,读取一行之后,把ansi字符串转换为utf8,之后写入文件。


    #include <stdio.h>
    #include <stdlib.h>
    #include <string.h>
    #include <windows.h>
    #include <assert.h>
    
    char* Unicode2Utf8(const char* unicode)
    {
    	int len;
    	len = WideCharToMultiByte(CP_UTF8, 0, (const wchar_t*)unicode, -1, NULL, 0, NULL, NULL);
    	char *szUtf8 = (char*)malloc(len + 1);
    	memset(szUtf8, 0, len + 1);
    	WideCharToMultiByte(CP_UTF8, 0, (const wchar_t*)unicode, -1, szUtf8, len, NULL,NULL);
    	return szUtf8;
    }
    
    char* Ansi2Unicode(const char* str)
    {
    	int dwUnicodeLen = MultiByteToWideChar(CP_ACP,0,str,-1,NULL,0);
    	if(!dwUnicodeLen)
    	{
    		return strdup(str);
    	}
    	size_t num = dwUnicodeLen*sizeof(wchar_t);
    	wchar_t *pwText = (wchar_t*)malloc(num);
    	memset(pwText,0,num);
    	MultiByteToWideChar(CP_ACP,0,str,-1,pwText,dwUnicodeLen);
    	return (char*)pwText;
    }
    
    char* ConvertAnsiToUtf8(const char* str)
    {
    	char* unicode = Ansi2Unicode(str); 
    	char* utf8 = Unicode2Utf8(unicode);
    	free(unicode);
    	return utf8;
    }
    
    int main(int argc, char *argv[])
    {
    	printf("Hello, world\n");
    	//1.构造一个ansi文件,内容是"中文abc",看hex编码.
    	//ansi: D6 D0 CE C4 61 62 63
    	//utf8: E4 B8 AD E6 96 87 61 62  63
    	char ansi[] = {0xD6,0xD0,0xCE,0xC4,0x61,0x62,0x63,0};
    	char utf8[] = {0xE4,0xB8,0xAD,0xE6,0x96,0x87,0x61,0x62,0x63,0};
    	char* str = ConvertAnsiToUtf8(ansi);
    	assert(!strcmp(str,utf8));
    	free(str);
    	return 0;
    }
    



    展开全文
  • vs 2017 保存文件 utf8

    万次阅读 2018-02-25 16:25:12
    vs 2017 保存文件 utf8
  • 但各种文本文件的编码方式不尽相同,特别是带有中文字符的文件,为GBK编码,一般加载后都会出现乱码情况,故需要在加载之前将文件的编码形式转为国际兼容的编码方式UTF-8。乱码也是一个很烦的问题,博主苦寻良久,...
  • UTF-16转UTF-8的方法,防止文件有BOM头

    千次阅读 2019-01-27 10:25:07
    一、前言 &nbsp;&nbsp;&nbsp;&nbsp;&...在读公司代码的时候,发现了一个UTF-16转UTF-8的方法,这还是博主第一次见到这种方法,... * @desc UTF-16转为UTF-8编码, 必须带有BOM文件头的才可以转, * ...
  • UTF-8】文件转换为utf-8编码

    千次阅读 2019-06-21 17:32:59
    主要用户UTF-16,UTF-32 它的存在干扰了软件使用UTF-8,所以不带最好 问题 在日常的编程过程中,有时需要合作开发,不同的人用不同的软件打开的文件有时编码格式不一样,特别是采用了中文的GB2312等等,用软件打开...
  • utf-8和utf-8-sig的区别(CSV文件 乱码)

    万次阅读 多人点赞 2019-07-17 14:35:45
    1、”utf-8“ 是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,因此它不需要BOM,所以当用"utf-8"编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理, 也就会发生类似上边的错误. ...
  • MFC读取utf8文件

    千次阅读 2014-12-30 11:43:20
    void CtempDlg::ConvertUTF8ToANSI(CString strUTF8,CString &strANSI... int nLen = ::MultiByteToWideChar(CP_UTF8,MB_ERR_INVALID_CHARS,(LPCTSTR)strUTF8,-1,NULL,0); //返回需要的unicode长度 WCHAR * wszANSI
  • MFC 如何读取UTF-8文件

    2015-05-11 02:41:18
    项目是UNICODE的字符集,现在想读取UTF-8文件并显示UTF-8文件如何编写代码,请各位大神解答 最好具体详细点,本人菜鸟一枚
  • utf-8文件的读写

    千次阅读 2017-02-10 13:19:33
    在转换.txt->csv 格式的时候,由于 txt 中包含了中文,编码格式为 utf-8,导致在使用 matlab 的时候出现了乱码。使用 load, textread 均无法导入文件。后来通过 fopen 函数打开文件,逐行读取文件,并逐行将读取的...
  • C++ 读写utf-8文件

    千次阅读 2016-12-27 14:44:24
    C++编码时有时会用到读写utf-8文件,c++11新特性里给了新的解决办法。
  • shell 去除utf8文件中bom头的方法

    万次阅读 2017-12-24 16:26:46
    本文介绍使用shell命令,批量去除utf8文件中bom头的方法。utf8的bom头由\xEF,\xBB,\xBF组成,带bom的文件在使用过程中,某些软件打开会出现乱码等异常,而要把文件重新另存为utf8无bom比较麻烦,因此直接使用shell...
  • 批量更换文件编码utf8

    千次阅读 2017-06-15 15:32:15
    一般文件打开不是utf8格式,所以在开发外国语言网站时会乱码,这时候就需要转换为utf8格式才不会,包括数据库也要用utf8格式,具体怎么转换,请看下面: 批量搜索文件的后缀,如.php .htm 使用EditPlusV3打开...
  • search.js文件内容: document.write('<...charset=utf-8"/>');... document.write("<div class='so'>...用editplus打开,此文件显示为正确的utf-8编码。 最后居然是乱码。。。。。奇怪了。。。。。
  • vs打开utf8编码文件

    千次阅读 2015-12-24 10:43:40
    选项里面的 text editor 勾选 自动检测utf-8编码。 如果注释还有乱码,打开注释所在文件文件tab,乱码立即变成正常了。
  • 将EXCEL文件转换成utf8编码的csv文件

    千次阅读 2014-03-03 19:17:17
    如何将EXCEL文件转换成utf8编码的csv文件   转载▼需要把EXCEL文件转换成utf8编码的csv文件。 现在是这样处理的: 第一步,用Excel创建文件,另存为 .csv 格式; 第二步,用记事本打开 CSV 文件,然后...
  • python读取utf-8文件

    千次阅读 2013-12-13 20:18:25
    在mac下python读取utf-8编码的txt文件,如果文件里有中文,直接输出的话会显示成乱码,也无法直接转成utf-8,所以必须想将其转成gbk,然后在转成utf-8 # -*- coding: utf-8 -*- import os filename = ...
  • python 按utf-8读取文件

    千次阅读 2020-03-09 14:53:17
    python 按utf-8读取文件 f = open("product.txt","r",encoding='utf-8') ProductLists = f.readlines() #按行读入,返回列表 f.close()
  • 【分享】Android Studio专用文件转换工具:把ANSI文件批量另存为无BOM的UTF-8文件 在Andoird Studio下编译java文件时,经常会出现像下面的错误: Error:(29, 43) 閿欒: 缂栫爜UTF-8鐨勪笉鍙槧灏勫瓧绗? 在这里...
  • 创建UTF-8的CSV文件

    千次阅读 2017-11-23 10:46:47
    需要把EXCEL文件转换成utf8编码的csv文件。 现在是这样处理的: 第一步,用Excel创建文件,另存为 .csv 格式; 第二步,用记事本打开 CSV 文件,然后另存为 UTF-8 格式
  • Qt读取UTF8与GBK格式文件乱码问题

    千次阅读 2019-02-16 10:25:24
    window下文件一般为GBK格式文件,而Linux系统下文件一般为UTF8文件,当文件读取格式不匹配时,读取到的数据显示为乱码,所以需要转码. GBK格式文件读取 QFile file("GBK.txt"); file.open(QFile::ReadOnly |...
  • Delphi 10 UTF8文件读写

    千次阅读 2019-01-31 16:50:42
    SS := TStringStream.Create('', TEncoding.UTF8); SS.LoadFromFile(FileName); Result := SS.DataString; end; procedure SaveUTF8File(Content:string;FileName: string); var SS: TStringStream; begin SS...
  • html 已经声明; charset=utf-8">引用文件编码为utf-8 的 js文件(用editplus打开,此文件显示为utf-8编码):<script type="text/javascript" charset="UTF-8" src="/js/wap/reg.js">在
  • python2读取utf8文件(中文)

    千次阅读 2017-11-19 18:22:00
    直接上代码咯。(windows7 x64, python2.7) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 #encoding=utf-8 #author:walker ...#function:示例python2读取utf8文件(含中文等特殊字符) impo...
  • #!/bin/bash if [[ -z "$1" ]];then echo '用法:./rmbom.sh [folder |... echo '将UTF-8编码的文件转化为UTF-8无BOM格式' exit 1 fi path=$1 find $path -type f -name "*" -print | xargs -i sed -i '1 s/^\x...
  • 之前由于忘记设置MyEclipse中文字格式,导致文件都是默认的GBK格式,由于后来的需求,需要把文件转化为UTF-8格式,为此我写了以下代码进行转换.这是大批量文件的转换,所以进行了文件遍历.(谨记:一定要在确定好编码转换...
  • utf-8文件转为ansi文件 python实现

    千次阅读 2018-11-06 22:25:27
    # UTF-8文件转 ANSI #coding:utf-8 import chardet import codecs file_path1 = "1.txt" file_path2 = "2.txt" # 查看文件编码方式.............................................................. f1=open(file...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 143,118
精华内容 57,247
关键字:

utf文件