精华内容
下载资源
问答
  • utf-8乱码
    千次阅读
    2021-02-12 21:30:30

    java中GBK转UTF-8乱码如何解决

    发布时间:2020-04-29 09:25:25

    来源:亿速云

    阅读:960

    作者:小新

    今天小编给大家分享的是java中GBK转UTF-8乱码如何解决,相信很多人都不太了解,为了让大家更加了解GBK转UTF-8乱码的解决方法,所以给大家总结了以下内容,一起往下看吧。一定会有所收获的哦。

    java中GBK转UTF-8乱码的解决方法

    如果自己采用的是GBK编码,对方采用得到是UTF-8编码,发送数据时需要将GBK编码数据转换成UTF-8编码数据,这样对方才不会乱码。

    问题出现:GBK转UTF-8时,奇数个中文会乱码,偶数个中文不会乱码。

    原因分析:public static void analyze() throws UnsupportedEncodingException {

    String gbk = "我来了";

    String utf8 = new String(gbk.getBytes("UTF-8"));

    for (byte b : gbk.getBytes("UTF-8")) {

    System.out.print(b + " ");

    }

    System.out.println();

    for (byte b : utf8.getBytes()) {

    System.out.print(b + " ");

    }

    }

    /*

    -26 -120 -111 -26 -99 -91 -28 -70 -122

    -26 -120 -111 -26 -99 -91 -28 -70 63 !

    */

    注意最后一个字节不同,上面一行才是正确的UTF-8编码。那么为什么下面一行最后一个字节是63,而不是-122呢?这就是导致乱码的原因所在。

    GBK编码是一个中文2个字节,而UTF-8编码是一个中文3个字节,当我们调用getBytes("UTF-8")方法时,会通过计算来增加字节,使得从GBK的2个字节变成UTF-8对应的3个字节。因此,上例3个中文输出了9个字节。

    ()

    解决问题

    保证字节正确才是硬道理。当调用getBytes("UTF-8")转换成字节数组后,创建ISO-8859-1编码的字符串,ISO-8859-1编码是一个字节对应一个字符,因此不会使最后一个字节错误。public static void correctEncode() throws UnsupportedEncodingException {

    String gbk = "我来了";

    String iso = new String(gbk.getBytes("UTF-8"),"ISO-8859-1");

    for (byte b : iso.getBytes("ISO-8859-1")) {

    System.out.print(b + " ");

    }

    System.out.println();

    //模拟UTF-8编码的网站显示

    System.out.println(new String(iso.getBytes("ISO-8859-1"),"UTF-8"));

    }

    /*

    -26 -120 -111 -26 -99 -91 -28 -70 -122

    我来了

    */

    关于java中GBK转UTF-8乱码如何解决就分享到这里了,希望以上内容可以对大家有一定的参考价值,可以学以致用。如果喜欢本篇文章,不妨把它分享出去让更多的人看到。

    更多相关内容
  • java utf-8 乱码的解决方法

    千次阅读 2021-02-12 12:21:38
    java utf-8 乱码的解决方法发布时间:2020-04-28 14:52:16来源:亿速云阅读:288作者:小新这篇文章主要为大家详细介绍了java utf-8 乱码的解决方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小...

    java utf-8 乱码的解决方法

    发布时间:2020-04-28 14:52:16

    来源:亿速云

    阅读:288

    作者:小新

    这篇文章主要为大家详细介绍了java utf-8 乱码的解决方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下。

    8c79da99c6fac87869e01460da0c2ece.png

    java utf-8 乱码怎么办?

    1.在html首部编写如下代码:

    pageEncoding="utf-8"%>

    示例如下:

    pageEncoding="utf-8"%>

    login.jsp

    姓名:

    密码:

    若不成功,

    2.对乱码工程文件属性修改,乱码如图所示

    pageEncoding="utf-8"%>

    login.jsp

    濮撳悕锛�

    瀵嗙爜锛�

    右键工程下的login.jsp,选择最下面的Properties

    6fae0df275cf25c79e76ebd04517f77b.png

    选择Other,改为utf-8

    2e4658b21abc1bdef8bc78afc023b380.png

    点击应用,OK

    若不成功,

    3.对工程右键进行如上操作

    576d61cc7ead7475d0f8d6187fd11f03.png

    如果依旧不成功,

    4.右键工程下的乱码文件,

    f44cfefea5752f4b39801f98453e1667.png

    点击红色方框中图案,找到原文件(也可自行在我的电脑中找到原文件)

    3a8123a0499d85850682f1e9abdc24d0.png

    使用Edit with Notepad++打开

    b18e374f558c79d2a43b120c89e667ef.png

    点击编码,选择“使用UTF-8编码”,然后保存

    4781a5fcb2905fe4677e27e6bd298ec9.png

    除了上述四种外,也可以通过如下图

    b1a4e42e4034bb09ced43c6491bf1ca8.png

    选择Project下的Properties进行属性修改

    以上就是java utf-8 乱码的解决方法的简略介绍,当然详细使用上面的不同还得要大家自己使用过才领会。如果想了解更多,欢迎关注亿速云行业资讯频道哦!

    展开全文
  • 文章目录VSCode终端和Windows Terminal中文UTF-8乱码解决方案中文UTF-8乱码问题中文UTF-8乱码解决方案其他chcp命令powershell和cmd VSCode终端和Windows Terminal中文UTF-8乱码解决方案 中文UTF-8乱码问题 VSCode...

    VSCode终端和Windows Terminal中文UTF-8乱码解决方案

    中文UTF-8乱码问题

    VSCode默认是UTF-8编码,而在中国地区下的 Windows的PowerShell和Cmd默认是gb2312编码。所以在VSCode中编写C++代码,并编译输出中文会出现中文乱码的情况,如下图:

    VSCode的中文UTF-8乱码

    PowerShell的中文UTF-8乱码

    Cmd的中文UTF-8乱码

    中文UTF-8乱码解决方案

    1)在VSCode中按下F1键,然后输入Open Settings Json,单击首选项:打开设置(json)选项进入settings.json文件,如下图所示:

    打开VSCode的用户settings.json文件

    在打开的settings.json中,先自动补全添加"terminal.integrated.profiles.windows"键,而后对"PowerShell""Command Prompt"的进行如下修改:

    {
            "PowerShell": {
                "source": "PowerShell",
                "icon": "terminal-powershell",
                "args": ["-NoExit","chcp 65001"]
            },
            "Command Prompt": {
                "path": [
                    "${env:windir}\\Sysnative\\cmd.exe",
                    "${env:windir}\\System32\\cmd.exe"
                ],
                "args": ["/K","chcp 65001"],
                "icon": "terminal-cmd"
            }
    }
    

    2)打开Windows Terminal,按下CRTL+,组合键进入设置,在配置文件中选择Windows PowerShell选项卡,将命令行文本框内容改为powershell.exe -NoExit chcp 65001,而后选择命令提示符选项卡,将命令行文本框内容改为cmd.exe /K chcp 65001,最后单击保存按钮,如下图所示:

    PowerShell配置文件命令行

    cmd配置文件命令行

    3)验证结果:VSCode的中文UTF-8完美显示Powershell的中文UTF-8完美显示Cmd的中文UTF-8完美显示

    其他

    chcp命令

    chcp命令用于显示和控制当前活动代码页。

    代码页编码
    936gb2312
    65001utf-8

    powershell和cmd

    1. powershell命令用于打开powershell,可以输入powershell /?查看powershell的参数选项,powershell -NoExit chcp 65001为用powershell执行chcp 65001命令,并且执行完毕后不离开powershell。
    2. cmd命令用于打开cmd,可以输入cmd /?查看cmd的参数选项,cmd /K chcp 65001为用cmd执行chcp 65001命令,并且执行完毕后不离开cmd。
    3. VSCode的terminal.integrated.profiles.windows键的args键用于控制终端启动参数选项。
    4. Windows Terminal的配置文件的命令行选项用于控制以什么命令打开该选项卡
    展开全文
  • 乱码原因:Tomcat命令窗口字符编码(GBK)与显示的字符编码(UTF-8)不匹配 解决方法:通过注册表修改Tomcat命令窗口的默认字符编码为UTF-8即可解决 第一步:Windows+R打开运行,输入regedit进入注册表编辑...

    乱码原因:Tomcat命令窗口字符编码(GBK)与显示的字符编码(UTF-8)不匹配

     

     

    解决方法:通过注册表修改Tomcat命令窗口的默认字符编码为UTF-8即可解决

    第一步:Windows+R打开运行,输入regedit进入注册表编辑器

    第二步:在HKEY_CURRENT_USER→Console→Tomcat中修改CodePage为十进制的65001

    注意:如果没有Tomcat或者CodePage,直接新建一个,如下图所示

     

     

     

    展开全文
  • python json utf-8乱码

    千次阅读 2018-11-09 15:45:19
    原文链接:... 读取的json文件,然后输出后乱码乱码均为\\u4e00\\u4e2a\\u7ea2\\u4eba\\u7684形式 解决方案: data=json.load(file('test.json')) jsonobj=json.dumps(data, ensure_asci...
  • HTTP中的utf-8乱码请求头

    千次阅读 2020-04-28 14:15:05
    掌握HTTP乱码请求头 res.setHeader(‘content-...charset=utf-8’); var http=require(‘http’); var server=http.createServer(); server.on(‘request’,function(req,res){ var url= req.url; if(url===’/aaa’...
  • 乱码产生的原因 世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误...UTF-8 是在互联网上使用最广的一种 Unicode 的实现方式 ...
  • ANSI转UTF-8中文无乱码解决方案

    千次阅读 2020-08-10 10:47:37
    ANSI转UTF-8中文无乱码解决方案
  • Idea 设置编码UTF-8 Idea中 .properties 配置文件中文乱码 一、设置编码 1、步骤: File -> Setting -> Editor -> File encodings --> 设置编码 二、配置文件中文乱码 1、步骤: File -&...
  • html声明charset="utf-8"后,浏览器访问中文依旧乱码(绝对有效) Created by Marydon on 2019-08-16 10:57 1.情景展示  html文件已经声明字符集为UTF-8,但是浏览器访问依旧乱码。  标题和页面内容都是乱码,这是...
  • 一个偶然的机会,我找到了解决UTF-8乱码的方法。 (1)将DW8的全部代码剪切到记事本,然后另存为tmp.txt,注意用utf-8编码保存,然后剪切到DW8; (2)注销或重启,重新打开DW8,这个时候看到,汉字全部乱码了,...
  • 提取文字出现乱码
  • C++控制台输出UTF-8乱码

    万次阅读 2018-08-03 11:52:43
    2019.11.2更新,可以设置控制台编码格式为UTF-8 chcp 65001 这样就不会乱码了.但需要每次手动输入 Win+R,输入regedit打开注册表编辑器HKEY_LOCAL_MACHINE\Software\Microsoft\Command Processor\ 右键新建一个...
  • 今天学习爬虫ing,结果不出所料的遇到了乱码,捣鼓了半天,翻了网上数种方法,终于在快裂开的时候,忽然眼前一亮,发现了一个新方法,...html =etree.HTML(r.text)s= etree.tostring(html).decode('utf-8')print(...
  • java utf-8中文乱码的四种解决方案

    万次阅读 2018-07-11 09:27:23
    lt;%@ page language="... charset=utf-8" pageEncoding="utf-8"%> 示例如下:<%@ page language="java" contentType="text/html; charset=utf-8" pag
  • 前段时间用某软件导出了一个CSV文件,需要在Excel中处理并打印,但是我直接用Excel打开这个CSV文件却发现,文件中的所有中文字符都变成了乱码,经过自己的尝试,采用数据导入的方法解决了问题,后来又搜了一下,发现...
  • ISO-8859-1,UTF-8 中文编码避免乱码

    千次阅读 2020-11-06 16:20:57
    new String(getBytes(ISO-8859-1),UTF-8)中文编码避免乱码 NewString(getBytes(ISO-8859-1)) byte[] b_gbk = "深".getBytes("GBK"); byte[] b_utf8 = "深".getBytes("UTF-8"); byte[] b_iso88591 = "深"....
  • 解决办法:修改MySQL数据库字符编码为UTF-8UTF-8包含全世界所有国家需要用到的字符,是国际编码。具体操作:1、进入MySQL控制台mysql -uroot -p#输入密码进入status;#查看当前MySQL运行状态,如下图所示:系统运维 ...
  • Python中文乱码的原因,Python中文乱码是由于Python在解析网页时默认用Unicode去解析,而大多数网站是utf-8格式的,并且解析 出来之后,python竟然再以Unicode字符格式输出,会与系统编码格式不同,导致中文输出...
  • 本来我已经参考网上关于C++中文输出乱码的文章解决了,如下面的代码输出前调用wcout.imbue设置locale,就可以正常输出中文了。 std::wcout.imbue(std::locale(std::locale(), "", LC_CTYPE)); std::wcout...
  • python使用UTF-8写入CSV中文乱码解决

    千次阅读 多人点赞 2019-12-25 09:35:04
    python使用UTF-8写入CSV中文乱码 使用encoding=‘utf-8’,写入的文档是乱码: def save_contents(urlist): with open("filename"+".csv","a+",newline='', encoding='utf-8') as f: writer = csv.writer(f) ...
  • 问题:查看中文时显示乱码 解决方案: 1、查看当前语言echo $LANG 2、修改语言vim /etc/locale.conf 把zh.cn_utf-8,修改成zh_CN.GB18030  3、立即生效 source /etc/locale.conf 4、检查是否中文还是显示乱码
  • eclipse引入的项目utf-8依然乱码

    千次阅读 2019-04-29 15:44:40
    在引入别人的一个项目之后乱码 原因:java source file 编译格式不一致 解决方法: Window-->preference---->general----->...然后看下面的编码方式,把utf-8 改成gbk 然后update ...
  • gbk转utf-8出现乱码

    千次阅读 2018-01-02 21:35:45
    看了别人的文章,总结的不错 引用:...问题出现:GBK转UTF-8时,奇数个中文会乱码,偶数个中文不会乱码。 三个中文public static void encodeError() throws UnsupportedEncodingException { Stri
  • 使用utf-8出现?乱码

    万次阅读 2019-02-20 19:06:44
    问题的根源,在于UTF-8这种编码里面,存在一个特殊的字符,其编码是“0xC2 0xA0”,转换成字符的时候,表现为一个空格,跟一般的半角空格(ASCII 0x20)一样,唯一的不同是它的宽度不会被压缩,因此比较多的被用于...
  • java gbk转utf-8乱码问题

    千次阅读 2016-09-14 13:53:52
    因此,我需要将GBK编码数据转换成UTF-8编码数据,这样对方网站才不会乱码。最简单的方法是将HttpClient的ContentCharset设置为utf-8;如果ContentCharset是gbk并且又不想设置为utf-8,那么就需要将数据转换成UTF-8...
  • eclipse uft-8 乱码问题

    千次阅读 2022-01-13 19:25:40
    eclipse uft-8乱码可以全部换成GBK 1.设置工作空间的编码为GBK (窗口)Window -----(属性)Preferences -----(常规)General -----(工作空间)Wordspace 2. 设置该项目的编码为GBK 右键项目后,点击...
  • GBK与UTF-8互转乱码详解

    万次阅读 2019-02-22 16:47:16
    在网络传输中,也是二进制数据,但最终呈现给用户的是字符串,二进制与字符串的转化就需要编码、解码的参与,如果世界上只有一种字符编码方式,就不会有乱码这一说了,但事实是,编码的方式太多了,utf-8、utf-32、...
  • Eclipse和项目都设置为utf-8编码格式,由于老项目开发人员层次不一,使用编码格式不规范导致存在GBK编码的JS文件(大多数是UTF-8格式)。 目录 乱码影像展示 设置编码格式 字符乱码解决方法 乱码影像展示 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 346,515
精华内容 138,606
关键字:

utf-8乱码