精华内容
下载资源
问答
  • 批量文件转码工具(支持 GBK,UTF-8 转换)。 批量文件转码工具,支持GBK,UTF-8转换,window下面使用,亲测可以使用!!!!!!!!!! 批量 文件转码 工具 GBK UTF-8
  • 批量文件转码工具,支持GBK,UTF-8转换,window下面使用,亲测可以使用!!!!!!!!!!
  • PB的utf-8转换

    热门讨论 2011-10-20 08:19:58
    PB的utf-8转换,包括加码解码等等 aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
  • 最近需要对Linux与Windows平台下的字符传输出现乱码,对...参考了网上的UTF-8/UTF-16转换的资料,只有0x10000以下的Unicode编码进行了转换;对其代码进行了修改和补充,可以实现所有的UTF-8/UTF-16的转换,分享给大家。
  • UTF-8/GBK编码转换工具

    2015-09-29 10:14:42
    UTF-8/GBK编码转换工具,支持批量文件转换,支持两种编码互转
  • UTF-8转换为ANSI

    千次阅读 2020-02-14 18:16:16
    使用OCR识别出来的字符为utf-8编码的,如果直接用C/C++中的cout或printf打印,中文会显示乱码的,因此要先将utf-8编码转换为C/C++中的ANSI编码,然后再用cout或printf打印即可。 wchar_t *utf_8ToUnicode(char *u8s)...

    使用OCR识别出来的字符为utf-8编码的,如果直接用C/C++中的cout或printf打印,中文会显示乱码的,因此要先将utf-8编码转换为C/C++中的ANSI编码,然后再用cout或printf打印即可。

    #include<leptonica\allheaders.h>
    #include<tesseract\baseapi.h>
    #include<iostream>
    #include<time.h>
    using namespace std;
    
    wchar_t *utf_8ToUnicode(char *u8s)
    {
    	int wcsLen = MultiByteToWideChar(CP_UTF8, NULL, u8s, strlen(u8s), NULL, NULL);
    	wchar_t *wcString = new wchar_t[wcsLen + 1];
    	MultiByteToWideChar(CP_UTF8, NULL, u8s, strlen(u8s), wcString, wcsLen);
    	wcString[wcsLen] = '\0';
    	return wcString;
    }
    char *unicodeToAnsi(wchar_t *wcString)
    {
    	int len = WideCharToMultiByte(CP_ACP, NULL, wcString, -1, NULL, NULL, NULL, NULL);
    	char *str = new char[len];
    	WideCharToMultiByte(CP_ACP, NULL, wcString, -1, str, len, NULL, NULL);
    	return str;
    }
    
    int main()
    {
    	clock_t start = clock();
    
    	tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI;
    	/*参数1为存放traineddata文件的文件夹tessdata的路径,如果已经在环境变量那里设置好了,
    	  那可以把它设置为NULL;参数2为字库文件名,chi_sim代表简体中文,chi_tra代表繁体
    	  中文,eng代表英文*/
    	if (api->Init(NULL, "chi_sim"))
    		exit(1);
    	Pix *image = pixRead("2.png");
    	api->SetImage(image);
    	char *outText = api->GetUTF8Text();
    	wchar_t *aaa = utf_8ToUnicode(outText);
    	outText = unicodeToAnsi(aaa);
    
    	clock_t end = clock();
    
    	cout << "OCR output:\n" << outText;
    	cout << end - start << " ms" << endl;
    
    	delete outText;
    	delete api;
    	return 0;
    }
    
    展开全文
  • 该工具是使用Qt5.9开发的。支持UTF-8与GB2312文件编码的相互批量转换
  • 批量将文件编码方式由ansi转为utf-8,方便快速,转换速度快并且无错误,容易操作。
  • 汉字编码转换工具,实现了汉字与 utf-8 gb2312 unicode 互转,开发者多百多度 qq:547170882
  • 本程序的目的是为了把文件编码格式统一。如果文件内容编码不同,则也不能保正...缺点:比如iso-8859-1的内容转换utf-8。则可能失败。。 优点:java文件,txt/xml/dat文件。只要都是能识别的内容,即转换成功就更大。
  • c gbk和 utf-8 转换

    2016-08-06 19:13:26
    c 源码, gbk和utf8 互相转换(不含库) 通过查表实现转换 实际转换为 gbk -- unicode --utf8
  • utf-8转换工具是非常好用的一款工具,用于将中文转换成utf-8格式的字符
  • utf-8和GBK编码文件互相转换,需要.net4.0。 压缩包是是源代码。可执行程序在bin\debug下面。
  • 解决GB2312、GBK、UTF-8转换问题

    万次阅读 2018-08-23 17:12:23
    UTF-8:是一种针对Unicode的可变长度字符编码,又称万国码。 现在手上一个项目正在上传基础数据,客户反馈某数据上传失败,我研究之后发现是客户上传的数据中“蘴”字导致的。可能之前code时没有注意生僻字转换的...

    GB2312:信息交换用汉字编码字符集(不支持生僻字的字符集,这是其本身限制的问题)。

    GBK:汉字编码字符集,向下与GB2312兼容(支持生僻字的字符集)。

    UTF-8:是一种针对Unicode的可变长度字符编码,又称万国码。

    现在手上一个项目正在上传基础数据,客户反馈某数据上传失败,我研究之后发现是客户上传的数据中“蘴”字导致的。可能之前code时没有注意生僻字转换的问题。

    首先贴上出错的上传数据“某某县某某田园蘴农业科技有限公司”,百度了一下,“蘴”读音为“feng”,读一声。

    问题代码:

    $data[$i] = iconv('gb2312', 'utf-8', $temp);    //iconv(原编码, 目标编码, 要转的字符串)

    这行代码本身没有错误,转换非生僻字也不会出错,但因生僻字“蘴”字的原因转换失败,转换为“false”。

    然后网上找类似问题,但发现根据如下网上的答案并没有从根本上解决这个问题:

    $data[$i] = iconv('gb2312', 'utf-8//IGNORE', $temp);

    加上“//IGNORE”会让iconv()函数忽略错误,继续执行。

    但转换为“某某县某某田园t农业科技有限公司”,此方法只是“压制”错误,将“蘴”错误的转换为“t”。

    此函数不行,那就换一个函数:

    $data[$i] = mb_convert_encoding($temp, 'utf-8', 'gb2312');    //mb_convert_encoding(要转的字符串, 目标编码, 原编码)

    转换为“连平县鸿益田园?农业科技有限公司”,此方法与上面函数相同,只是“压制”错误,将“蘴”错误的转换为“?”

    此时,我才意识到,不是函数的问题,是编码的问题:GB2312是不支持生僻字的。

    果然,将编码换了一下这个问题就解决了:

    $data[$i] = mb_convert_encoding($temp, 'utf-8', 'gbk');

    转换为“某某县某某田园蘴农业科技有限公司”,转换成功。

    吃一堑长一智,提醒自己这么“弱智”的问题要牢记!!!

     

    展开全文
  • PB9转换utf-8例子

    热门讨论 2014-12-26 16:34:58
    PB9及以下版本没有直接转换字符编码的函数或方法,本例子使用ADODB.Stream进行转换
  • UTF-8 UTF-16 UTF-32转换代码 C语言编写
  • UTF-8(with BOM)与UTF-8相互转换

    千次阅读 2020-04-13 15:08:00
    @[TOC](UTF-8(with BOM)与UTF-8相互转换) VS采用UTF-8 BOM格式编码,而Linux下采用UTF-8无BOM格式。BOM用来标记编码的字节顺序,但是由于编码字节顺序对于UTF-8来说无关紧要,而且Unicode标准也并不推荐使用带BOM的...

    VS采用UTF-8 BOM格式编码,而Linux下采用UTF-8无BOM格式。BOM用来标记编码的字节顺序,但是由于编码字节顺序对于UTF-8来说无关紧要,而且Unicode标准也并不推荐使用带BOM的UTF-8编码格式。总之,由于Windows和Linux的不同,为避免使用Notepad++手动更改大量文件的繁琐,提供shell转换脚本如下:

    UTF-8(with BOM)转UTF-8:

    #!/bin/bash
    #将UTF-8带BOM编码的文件转化为UTF-8无BOM格式
    if [[ -z "$1" ]];then
        echo '用法:./rmbom.sh [folder | file]'
        echo '将UTF-8编码的文件转化为UTF-8无BOM格式'
        exit 1
    fi
     
     
    path=$1
    find $path -type f -name "*" -print | xargs -i sed -i '1 s/^\xef\xbb\xbf//' {}
    echo "Convert finish"
    

    UTF-8转UTF-8(with BOM):

    #!/bin/bash
    #将UTF-8无BOM编码的文件转化为UTF-8带BOM格式
     
     
    if [[ -z "$1" ]];then
        echo '用法:./addbom.sh [folder | file]'
        echo '将UTF-8无BOM格式编码的文件转化为UTF-8带BOM'
        exit 1
    fi
     
     
    path=$1
    find $path -type f -name "*" -print | xargs -i sed -i '1 s/^/\xef\xbb\xbf&/' {}
    echo "Convert finish"
    

    ————————————————
    原文链接:https://blog.csdn.net/fanyun_01/article/details/78378724

    展开全文
  • C++ ANSI 与 utf-8转换

    千次阅读 2018-05-25 18:05:25
    //UTF8转ANSI&nbsp;&nbsp;void&nbsp;UTF8toANSI(CString&nbsp;&amp;strUTF8)&nbsp;&nbsp;{&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;//获取转...




    1. //UTF8转ANSI  
    2. void UTF8toANSI(CString &strUTF8)  
    3. {  
    4.     //获取转换为多字节后需要的缓冲区大小,创建多字节缓冲区  
    5.     UINT nLen = MultiByteToWideChar(CP_UTF8,NULL,strUTF8,-1,NULL,NULL);  
    6.     WCHAR *wszBuffer = new WCHAR[nLen+1];  
    7.     nLen = MultiByteToWideChar(CP_UTF8,NULL,strUTF8,-1,wszBuffer,nLen);  
    8.     wszBuffer[nLen] = 0;  
    9.   
    10.     nLen = WideCharToMultiByte(936,NULL,wszBuffer,-1,NULL,NULL,NULL,NULL);  
    11.     CHAR *szBuffer = new CHAR[nLen+1];  
    12.     nLen = WideCharToMultiByte(936,NULL,wszBuffer,-1,szBuffer,nLen,NULL,NULL);  
    13.     szBuffer[nLen] = 0;  
    14.       
    15.     strUTF8 = szBuffer;  
    16.     //清理内存  
    17.     delete []szBuffer;  
    18.     delete []wszBuffer;  
    19. }  
    //UTF8转ANSI
    void UTF8toANSI(CString &strUTF8)
    {
        //获取转换为多字节后需要的缓冲区大小,创建多字节缓冲区
        UINT nLen = MultiByteToWideChar(CP_UTF8,NULL,strUTF8,-1,NULL,NULL);
        WCHAR *wszBuffer = new WCHAR[nLen+1];
        nLen = MultiByteToWideChar(CP_UTF8,NULL,strUTF8,-1,wszBuffer,nLen);
        wszBuffer[nLen] = 0;
    
        nLen = WideCharToMultiByte(936,NULL,wszBuffer,-1,NULL,NULL,NULL,NULL);
        CHAR *szBuffer = new CHAR[nLen+1];
        nLen = WideCharToMultiByte(936,NULL,wszBuffer,-1,szBuffer,nLen,NULL,NULL);
        szBuffer[nLen] = 0;
    
        strUTF8 = szBuffer;
        //清理内存
        delete []szBuffer;
        delete []wszBuffer;
    }
    1. //ANSI转UTF8  
    2. void ANSItoUTF8(CString &strAnsi)  
    3. {  
    4.     //获取转换为宽字节后需要的缓冲区大小,创建宽字节缓冲区,936为简体中文GB2312代码页  
    5.     UINT nLen = MultiByteToWideChar(936,NULL,strAnsi,-1,NULL,NULL);  
    6.     WCHAR *wszBuffer = new WCHAR[nLen+1];  
    7.     nLen = MultiByteToWideChar(936,NULL,strAnsi,-1,wszBuffer,nLen);  
    8.     wszBuffer[nLen] = 0;  
    9.     //获取转为UTF8多字节后需要的缓冲区大小,创建多字节缓冲区  
    10.     nLen = WideCharToMultiByte(CP_UTF8,NULL,wszBuffer,-1,NULL,NULL,NULL,NULL);  
    11.     CHAR *szBuffer = new CHAR[nLen+1];  
    12.     nLen = WideCharToMultiByte(CP_UTF8,NULL,wszBuffer,-1,szBuffer,nLen,NULL,NULL);  
    13.     szBuffer[nLen] = 0;  
    14.       
    15.     strAnsi = szBuffer;  
    16.     //内存清理  
    17.     delete []wszBuffer;  
    18.     delete []szBuffer;  
    19. }  
    //ANSI转UTF8
    void ANSItoUTF8(CString &strAnsi)
    {
        //获取转换为宽字节后需要的缓冲区大小,创建宽字节缓冲区,936为简体中文GB2312代码页
        UINT nLen = MultiByteToWideChar(936,NULL,strAnsi,-1,NULL,NULL);
        WCHAR *wszBuffer = new WCHAR[nLen+1];
        nLen = MultiByteToWideChar(936,NULL,strAnsi,-1,wszBuffer,nLen);
        wszBuffer[nLen] = 0;
        //获取转为UTF8多字节后需要的缓冲区大小,创建多字节缓冲区
        nLen = WideCharToMultiByte(CP_UTF8,NULL,wszBuffer,-1,NULL,NULL,NULL,NULL);
        CHAR *szBuffer = new CHAR[nLen+1];
        nLen = WideCharToMultiByte(CP_UTF8,NULL,wszBuffer,-1,szBuffer,nLen,NULL,NULL);
        szBuffer[nLen] = 0;
    
        strAnsi = szBuffer;
        //内存清理
        delete []wszBuffer;
        delete []szBuffer;
    }


    自己改的c版本,测试可用:

    static void UTF8toANSI(char *strUTF8,char*out_ansi)
    {
    //获取转换为多字节后需要的缓冲区大小,创建多字节缓冲区
    UINT nLen = MultiByteToWideChar(CP_UTF8, 0, strUTF8, -1, NULL, 0);
    WCHAR wszBuffer = (WCHAR)malloc((nLen+1)*sizeof(WCHAR));
    nLen = MultiByteToWideChar(CP_UTF8, 0, strUTF8, -1, wszBuffer, nLen);
    wszBuffer[nLen] = 0;

    nLen = WideCharToMultiByte(936, 0, wszBuffer, -1, NULL, 0, NULL, NULL);
    nLen = WideCharToMultiByte(936, 0, wszBuffer, -1, out_ansi, nLen, NULL, NULL);
    out_ansi[nLen] = 0;
    

    }

    展开全文
  • C++11 wstring与utf-8 转换

    千次阅读 2018-03-22 17:29:06
    UTF-8转换 /*************************************************************/ /* RFC 3629 defines the mapping as follows : * * Char. number range | UTF-8 octet sequence * (hexadecimal) |...
  • swt制作,能将普通编码的文字转换utf-8
  • 中文-UTF-8编码转换

    热门讨论 2011-04-07 11:06:38
    有时候utf-8的网站 需要点中文或者特殊符号,会出现乱码,用这个就可以转换utf-8 可以识别的转意字符
  • PowerBuilder9.0开发环境下,可以把UTF-8的编码转换为Unicode的编码格式,在pb9.0环境下测试通过。
  • UCS-2转换utf-8代码

    2015-05-21 15:14:17
    将ucs-2转换utf-8代码集完整版
  • C++中UTF-8转换成string

    千次阅读 2017-06-07 11:32:34
    本来想着有没有直接将UTF-8编码转换成string的函数,查找了半天,然而并没有,无奈只好自己封装了一个,使用了C++11,代码如下: std::string MyString::UnicodeToAscii(const std::wstring str) { int iTextLen =...
  • c++ UTF-8 UTF-16转换

    2013-05-01 12:35:57
    宽字节和多字节转换,利用C++实现UTF-8和UTF-16之间的转换,包括错误处理
  • C++ UTF-8 转换助手 本文源码0积分下载地址:http://download.csdn.net/detail/zy_dreamer/5319311 这篇文章介绍如何用C++,Win32SDK和STL 实现在UTF-8和UTF-16之间进行转换。 使用技术:Win32,C++,Windows SDK...
  • 所以不含 BOM 的 UTF-8 才是标准形式,在 UTF-8 文件中放置 BOM 主要是微软的习惯(顺便提一下:把带有 BOM 的小端序 UTF-16 称作「Unicode」而又不详细说明,这也是微软的习惯)。 BOM是为 UTF-16 和 UTF-32 准备的...
  • 将utf8转换成asciiI have a java code and I want to convert it into Utf-8. How can I do it in console. By the way I have multiple files so it need to be do multiple conversion. 我有一个Java代码,我想将...
  • UTF-8转ANSI文本文件转换

    热门讨论 2010-07-28 23:18:13
    可批量将UTF-8的文本文件转为ANSI文本文件,代码略加修改,即可在换任意两种编码的文本文件内互相转化。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 550,272
精华内容 220,108
关键字:

utf-8怎么转换