2015-04-09 14:22:04 xingyuaini 阅读数 21

http://jingyan.baidu.com/article/ab69b270de8b4f2ca7189f1d.html

2015-11-26 19:36:35 sj836125 阅读数 520
 public static String toUf8String(String s) {
                  StringBuffer sb = new StringBuffer();
                  for (int i = 0; i < s.length(); i++) {
                    char c = s.charAt(i);
                    if (c >= 0 && c <= 255) {
                      sb.append(c);
                    }
                    else {
                      byte[] b;
                      try {
                        b = Character. toString(c).getBytes("utf-8");
                      }
                      catch (Exception ex) {
                        System. out.println(ex);
                        b = new byte [0];
                      }
                      for (int j = 0; j < b.length; j++) {
                        int k = b[j];
                        if (k < 0)
                          k += 256;
                        sb.append( "%" + Integer.toHexString(k).
                                  toUpperCase());
                      }
                    }
                  }
                  return sb.toString();

                }
2019-03-15 11:17:24 qq_41980563 阅读数 1213

文字编码不对会造成中文乱码

  1. 部署在Linux的java web网页页面显示乱码
    在这里插入图片描述
  2. 用locale查看系统编码
    在这里插入图片描述
  3. vim /etc/locale.conf修改成LANG=en_US.UTF-8
  4. 重启后查看编码和web,乱码消失了。
    在这里插入图片描述在这里插入图片描述
2014-05-08 12:36:45 mobbn 阅读数 158

ssh登陆linux 显示中文乱码,解决方法 

方法一: 修改/root/.bash_profile文件,增加export LANG=zh_CN.GB18030


 


使用该方法时putty能显示中文


方法二:


引用:

修改/etc/sysconfig/i18n文件


#LANG="en_US.UTF-8"
#SUPPORTED="en_US.UTF-8:en_US:en"
#SYSFONT="latarcyrheb-sun16"


改为


LANG="zh_CN.GB18030"
LANGUAGE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"
SUPPORTED="zh_CN.GB18030:zh_CN:zh"
SYSFONT="lat0-sun16"
SYSFONTACM="8859-15"

2016-04-19 16:05:19 bitcarmanlee 阅读数 937

下来搜狐实验室一些新闻语料做分析,结果打开发现其他标签都正常,就<content>标签内容不正常,全是乱码。因此估计十有八九是编码问题。上网找了下linux里怎么解决中文乱码的问题。

其实挺简单,用iconv命令就可以轻松搞定。linux里默认的字符集编码方式是utf-8,而下载的内容的编码格式应该是gbk,所以用如下命令:

cat news.allsites.1120806.txt | iconv -f gbk -t utf-8 -c | grep "<content>" >zzz

iconv命令就是将制定文件从一种编码方式换到另外一种一种编码。
-f,–from-code ,表示文本的原始编码方式
-t, –to-code 表示文本的输出编码方式
-c 表示在输出中忽略无效字符

最后再配合grep命令,就将文本中的正文内容提取出来

centos中文乱码

阅读数 8

没有更多推荐了,返回首页