精华内容
下载资源
问答
  • 编码转换
    千次阅读
    2022-04-13 10:49:59


    /**
     * 
     * 功能作用:
     * 字符串工具类
     * @version:      1.0
     * @create date: 2012-12-7
     * @author:      lili
     * @remark:
     */
    public class StringUtil {
        
        /**
         * 字符串编码转换的实现方法
         * @param str    待转换的字符串
         * @param newCharset    目标编码
         */
        public static String changeCharset(String str, String newCharset) {
            String newStr = "";
            try{
                if(str != null && "" != str) {
                    //用默认字符编码解码字符串。与系统相关,中文windows默认为GB2312
    //                byte[] bs = str.getBytes();
                    newStr = new String(str.getBytes("ISO8859-1"), newCharset);    //用新的字符编码生成字符串
                }
            }catch (Exception e) {
            }
            return newStr;
        }

    }

    更多相关内容
  • PowerBuilder9.0开发环境下,可以把UTF-8的编码转换为Unicode的编码格式,在pb9.0环境下测试通过。
  • GBK编码转换

    千次阅读 2022-03-30 11:42:28
    ## 0X01 GBK编码查询 GBK编码与汉字之间的转换。 查看字符编码(简体中文)http://www.mytju.com/classcode/tools/encode_gb2312.asp ## 0X02

    ## 0X01 GBK编码查询

    GBK编码与汉字之间的转换。

    查看字符编码(简体中文)icon-default.png?t=M276http://www.mytju.com/classcode/tools/encode_gb2312.asp

    ## 0X02

    展开全文
  • 编码转换可转utf-8等..............
  • ASCII码及UCS2编码转换器,包含中文编解码,C#编写,用过都说好,ASCII码及UCS2编码转换器,包含中文编解码,C#编写,用过都说好,
  • K8-Web编码转换工具.exe

    2015-11-23 12:42:37
    K8-Web编码转换工具.exe
  • Python合集之Python字符串编码转换

    千次阅读 2021-03-17 02:43:51
    最早的字符串编码是美国标准信息交换码,即ASCII码,他仅对10个数字,26个大写英文字母、26个小写英文字母及一些其他符号进行了编码。ASCII码最多只能表示256个符号,每个符号占一个字节。随着信息技术的发展,各国...

    最早的字符串编码是美国标准信息交换码,即ASCII码,他仅对10个数字,26个大写英文字母、26个小写英文字母及一些其他符号进行了编码。ASCII码最多只能表示256个符号,每个符号占一个字节。随着信息技术的发展,各国文字都需要进行编码,于是出现了GBK、GB2312、UTF-8编码等。其中GBk和GB2312是我国制定的中文编码标准,使用一个字节表示英文字母,2个字节表示中文字符。而UTF-8是我国通用的编码,对全世界所有国家用到的字符都进行了编码。UTF-8采用一个字节表示英文字符、3个字节表示中文。在Python3.X中。默认采用的编码格式为UTF-8,采用这种编码有效地解决了中文乱码的问题。

    在Python中,有两种常用的字符串类型,分别是str和bytes。其中str表示Unicode字符(ASCII码或者其他)bytes表示二进制数据(包括编码的文本)。这两种类型的字符串不能拼接在一起使用。通常情况下,str在内存中以Unicode表示,一个字符对应诺干个字节。但是如果在网络上传输,或者保存到磁盘上,就需要把str转换为字节类型,即bytes类型。

    注:bytes类型的数据时带有b前缀的字符串(用单引号或者双引号表示)例如 b'\xd2\xb0'和'bmr'都是bytes类型的数据。

    str类型和bytes类型之间可以通过encode()和decode()方法进行转换,这两个方法是互逆的过程。

    1.使用encode()方法编码

    encode()方法为str对象方法,用于将字符串转换为二进制数据(即bytes)也称为编码,其语法格式如下:

    str.encode([encoding="utf-8"][,errors="strict"])

    参数说明:

    str:表示要进行转换的字符串

    encoding="utf-8":可选参数,用于指定进行转码时采用的字符编码,默认为UTF-8,如果想使用简体中文,也可以设置为gb2312。

    当只有一个参数时,也可省略前面的encoding=,直接写编码。

    errors="strict":可选参数,用于指定错误处理方式,其可选址值strict(遇到非法字符就抛出异常)

    ignore(忽略非法字符)、

    replace(用?替换非法字符)或

    xmlcharrefreplace(使用xml的字符引用)等,默认为strict。

    注:在使用encode()方法时,不会修改原字符串,如果需要修改原字符串,需要对其进行重新赋值。

    例如:

    verse='野渡无人舟自横'byte=verse.encode('GBK')print('原字符串:',verse)print('转换后:',byte)

    2.使用decode()方法

    decode()方法为bytes对象的方法,用于将二进制转换为字符串,即将使用encode()方法转换的结果再转换为字符串,也称为“解码”,语法格式如下:

    bytes.decode([encoding="utf-8"][,errors="strict"])

    参数说明:

    bytes:表示要进行转为二进制数据,通过是encode()方法转换后的结果。

    encoding="utf-8":可选参数,用于指定进行解码时采用的字符编码默认为utf-8,如果想使用简体中文,可以设置为gb2312。

    当只有一个参数时,可以省略前面的encoding=,直接写编码。

    errors="strict":可选参数,用于指定错误处理方式,其可选址值strict(遇到非法字符就抛出异常)

    ignore(忽略非法字符)、

    replace(用?替换非法字符)或

    xmlcharrefreplace(使用xml的字符引用)等,默认为strict。

    注:在使用decode()方法时,不会修改原字符串,如果需要修改原字符串,需要对其进行重新赋值。

    例如:上面示例中编码后得到的结果,在这里进行解码:

    print('解码后:',byte.decode('GBK'))

    花絮:

    本期的Python 字符串编码的转换就分享到这里,下期我们将继续分享Python字符串正则表达式的相关知识,感兴趣的朋友可以关注我。

    同时也可以关注下我的个人 微信订阅号,园子里面的文章也会第一时间在订阅号里面进行推送跟更新。

    展开全文
  • 中文-UTF-8编码转换

    热门讨论 2011-04-07 11:06:38
    有时候utf-8的网站 需要点中文或者特殊符号,会出现乱码,用这个就可以转换成utf-8 可以识别的转意字符
  • Java 正确的做字符串编码转换

    千次阅读 2021-02-12 14:25:30
    如果源码文件是GBK编码, 操作系统(windows)默认的环境编码为GBK,那么编译时, JVM将按照GBK编码将字节数组解析成字符,然后将字符转换为unicode格式的字节数组,作为内部存储。当打印这个字符串时,JVM 根据操作系统...

    字符串的内部表示?

    字符串在java中统一用unicode表示( 即utf-16 LE) ,

    对于 String s = "你好哦!";

    如果源码文件是GBK编码, 操作系统(windows)默认的环境编码为GBK,那么编译时,  JVM将 按照GBK编码将字节数组解析成字符,然后将字符转换为unicode格式的字节数组,作为内部存储。

    当打印这个字符串时,JVM 根据操作系统本地的语言环境,将unicode转换为GBK,然后操作系统将GBK格式的内容显示出来。

    当源码文件是UTF-8, 我们需要通知编译器源码的格式,javac -encoding utf-8 ... , 编译时,JVM按照utf-8 解析成字符,然后转换为unicode格式的字节数组, 那么不论源码文件是什么格式,同样的字符串,最后得到的unicode字节数组是完全一致的,显示的时候,也是转成GBK来显示(跟OS环境有关)

    乱码如何产生?本质上都是由于 字符串原本的编码格式 与 读取时解析用的编码格式不一致导致的。

    例如:

    String s = "你好哦!";

    System.out.println( new String(s.getBytes(),"UTF-8")); //错误,因为getBytes()默认使用GBK编码, 而解析时使用UTF-8编码,肯定出错。

    其中 getBytes() 是将unicode 转换为操作系统默认的格式的字节数组,即"你好哦"的 GBK格式,

    new String (bytes, Charset) 中的charset 是指定读取 bytes 的方式,这里指定为UTF-8,即把bytes的内容当做UTF-8 格式对待。

    如下两种方式都会有正确的结果,因为他们的源内容编码和解析用的编码是一致的。

    System.out.println( new String(s.getBytes(),"GBK"));

    System.out.println( new String(s.getBytes("UTF-8"),"UTF-8"));

    那么,如何利用getBytes 和 new String() 来进行编码转换呢?网上流传着一种错误的方法:

    GBK--> UTF-8:    new String( s.getBytes("GBK") , "UTF-8);   ,这种方式是完全错误的,因为getBytes 的编码与  UTF-8 不一致,肯定是乱码。

    但是为什么在tomcat 下,使用 new String(s.getBytes("iso-8859-1") ,"GBK") 却可以用呢? 答案是:

    tomcat 默认使用iso-8859-1编码, 也就是说,如果原本字符串是GBK的,tomcat传输过程中,将GBK转成iso-8859-1了,

    默认情况下,使用iso-8859-1读取中文肯定是有问题的,那么我们需要将iso-8859-1 再转成GBK, 而iso-8859-1 是单字节编码的,

    即他认为一个字节是一个字符, 那么这种转换不会对原来的字节数组做任何改变,因为字节数组本来就是由单个字节组成的,

    如果之前用GBK编码,那么转成iso-8859-1后编码内容完全没变, 则 s.getBytes("iso-8859-1")  实际上还是原来GBK的编码内容

    则 new String(s.getBytes("iso-8859-1") ,"GBK")  就可以正确解码了。 所以说这是一种巧合。

    如何正确的将GBK转UTF-8 ? (实际上是unicode转UTF-8)

    String gbkStr = "你好哦!"; //源码文件是GBK格式,或者这个字符串是从GBK文件中读取出来的, 转换为string 变成unicode格式

    //利用getBytes将unicode字符串转成UTF-8格式的字节数组

    byte[] utf8Bytes = gbkStr.getBytes("UTF-8");

    //然后用utf-8 对这个字节数组解码成新的字符串

    String utf8Str = new String(utf8Bytes, "UTF-8");

    简化后就是:

    unicodeToUtf8 (String s) {

    return new String( s.getBytes("utf-8") , "utf-8");

    }

    UTF-8 转GBK原理也是一样

    return new String( s.getBytes("GBK") , "GBK");

    其实核心工作都由  getBytes(charset) 做了。

    getBytes 的JDK 描述:Encodes this String into a sequence of bytes using the named charset, storing the result into a new byte array.

    另外对于读写文件,

    OutputStreamWriter w1 = new OutputStreamWriter(new FileOutputStream("D:\\file1.txt"),"UTF-8");

    InputStreamReader( stream, charset)

    可以帮助我们轻松的按照指定编码读写文件。

    展开全文
  • javascript怎么对url进行编码转换

    万次阅读 2022-01-14 17:34:30
    javascript对url进行编码转换的方法: 1、使用encodeURI()函数,可把字符串作为URI进行编码; 2、使用encodeURIComponent()函数,可把字符串作为URI组件进行编码。 项目中url遇到传参数传数组对象解析失败问题,...
  • Java String 类型编码转换

    千次阅读 2021-02-27 17:59:28
    java中的String类是按照unicode进行编码的,当使用String(byte[] bytes, Stringencoding)构造字符串时,encoding所指的是bytes中的数据是按照那种方式编码的,而不是最后产生的String是什么编码方式,换句话说,是让...
  • java中的编码转换(以utf8和gbk为例)

    千次阅读 2021-10-21 12:26:46
    在正常javaweb开发中经常会发现字符转换的需求,会存在中文字符转换乱码的现象,如何解决以及其转换原理我至今懵懵懂懂,于是专门写了个测试代码进行尝试,总算理清了编码,先上结论,总结如下: utf8中存放有各种...
  • 中文短信编码转换工具

    热门讨论 2011-05-04 15:30:09
    PDU模式下中文短信编码互转,中文——>Unicode,Unicode——>中文,方便将超级终端收到的中文短信的16进制编码转换为中文,也可将要发送的中文转换为PDU16进制编码。
  • IDEA 文件编码转换

    千次阅读 2019-09-27 11:06:53
    IDEA 文件编码转换 1 单个文件转换 如图:窗口右下角有切换方式 场景:引入项目,原项目是 GBK编码格式,现在工作空间是UTF-8编码格式,会导致文件中文乱码。 解决: 1.先将文件编码 转成GBK,选择Reload,此时只是...
  • http://www.pc0359.cn/downinfo/82276.html 超级批量编码转换
  • 可以把文字进行各种编码转换,比如gbk-utf8、或者对文字进行url编码解码。绿色的。
  • emoji表情编码转换

    千次阅读 2020-07-07 10:37:40
    见下面链接 https://www.jianshu.com/p/8a416537deb3
  • 完成GB2312、Big5、GBK、Unicode 、Unicode big endian、UTF-8共6种编码之间的任意转换。详情参见 http://blog.csdn.net/ziyuanxiazai123/article/details/7495690
  • 编码转换以及乱码恢复

    万次阅读 2019-06-19 15:01:28
    ASCII编码 128个字符用7个位表示,计算机最小存储单位是byte,即8位。ASCII最高位是0,剩余7位表示字符。7位刚好表示0-127。 具体表示如下: Ascii 码对美国是够用了,但对别的国家而言却是不够的,于是,各个...
  • java字符串的各种编码转换

    万次阅读 2018-01-11 18:32:17
     /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符,也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final String US_ASCII = "US-ASCII"; 
  • 汉字编码转换工具,实现了汉字与 utf-8 gb2312 unicode 互转,开发者多百多度 qq:547170882
  • Python字符串编码转换

    千次阅读 2019-03-26 20:07:00
    字符串编码转换 最早的字符串编码是ASCII码,只包括0-9的数字,A-Z和a-z的字母以及空格、制表符等其他符号共256个字符。 随着信息技术的发展,各国的文字都需要进行编码,因此就出现了 GBK/GB2312 编码以及 UTF-...
  • C++:中文编码转换

    万次阅读 多人点赞 2018-07-13 19:47:42
    C++11标准库,中文编码转换问题。
  • 文本文件编码转换工具 gbk utf8 gb2312

    千次下载 热门讨论 2010-01-26 18:27:23
    如此一来整站编码就都是国际能用的utf8编码了.通用性现在做到最好了. 问题也是有的,在此环境下涉及到数据库运行的文件都必须是 utf8编码.这样一来就出现了不兼容,因为在国内大家都是以GBK gb2312编的码 包括 17...
  • GBK 汉字编码转换

    千次阅读 2020-07-01 19:56:15
    /** * 描述:汉字转GBK码 * @param word * @return */ public String wordToGBk (String word) throws UnsupportedEncodingException { String[] wordArray; String GBK=""; wordArray = word.split("");...
  • Windows下文本文件编码转换

    千次阅读 2020-06-18 20:59:17
    在Windows下可以使用记事本进行文本文件的编码转换操作。 以下用示例来说明(本示例使用windows 7): 1, 打开 记事本 ,将以下文件内容复制到窗口中 时间序列存储在容器中,容器类型似于表,时间序列的数据是连续的...
  • 编码转换工具,支持40种编码格式转换,支持目录下所有文件编码转换和筛选不同后缀的文件。
  • python3中字符编码转换

    千次阅读 2018-10-09 16:34:05
    # Python3编码转换已经不像python2那样让人崩溃, 但是在使用过程中需要遵循一定规则 # 各种编码的互相转换, 都要先decode解码为unicode编码, 然后通过unicode再encode编码为想要的编码 s = '我是Python' # ...
  • 本文用于介绍不同编码格式的string(char*)之间的转换。明确Unicode,UTF-8,string,wstring概念,以及locale name之前, 先简单了解两个概念 字符集: 为每一个字符(asic,中文,日文,俄文等)分配一个唯一的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 951,773
精华内容 380,709
关键字:

编码转换