精华内容
下载资源
问答
  • locale -a 查看有哪些字符集 utf8的就可以显示中文 yum -y install kde-l10n-Chinese 安装后选个uft8的 ,设置一下全局变量 vi /etc/profile export LANG=en_CA.utf8 =号后面是字符集,这个大家随意 最后让这...

    1.locale 查看现在使用的字符集

    locale -a 查看有哪些字符集

    utf8的就可以显示中文

    yum -y install kde-l10n-Chinese
    安装后选个uft8的 ,设置一下全局变量

    vi /etc/profile

    export LANG=en_CA.utf8

    =号后面是字符集,这个大家随意

    最后让这个配置文件生效就可以了

    . /etc/profile 

    可能会出现下次登录这个全局没有了情况,解决办法查看我的另一篇文章

    展开全文
  • 字符集 java

    2021-06-01 21:55:10
    1 有哪些字符集? 1)ASCII:美国标准信息交换码,用一个字节的7位可以表示。 2)ISO8859-1:拉丁码表,欧洲码表,用一个字节的8位表示。 3)GB2312:中国的中文编码表,最多两个字符编码所有字符,英文还是沿用...

    字符集

    1 有哪些字符集?

    1)ASCII:美国标准信息交换码,用一个字节的7位可以表示。

    2)ISO8859-1:拉丁码表,欧洲码表,用一个字节的8位表示。

    3)GB2312:中国的中文编码表,最多两个字符编码所有字符,英文还是沿用ASCII的一个字节表示一个字母,为的是节省空间。

    4)GBK:中国的中文编码表升级,融合了更多的中文文字符号,还是最多两个字节编码。

    5)Unicode:国际标准码,融合了目前人类使用的所有字符,为每个字符分配唯一的字符码,所有的语言每一个字符都有对应的字符编码,所有的文字都用2个字节表示。Unicode字符集知识定义了字符的集合和唯一编号,Unicode编码,则是对UTF-8,UCS-2/UTF-16等具体编码方式的统称而已,并不是具体的编码方案。

    6)UTF-8:变长的编码方式,可用1-4个字节表示一个字符。(后续修正可能使用6个字节)

    2 问题

    1)中文码表最多两个字节表示一个字符,那么有没有可能会将两个字母字节当做成一个两个字节大小的中文字符来读取呢?采用的办法就是,在首个字节的首位做标记,如果首个字节的首位是1就代表两个字节读取一个字符,如果首位是0,则表示当前只需要读一个字节。

    2)使用Unicode编码时也会出现不知道是将两个字节读为一个字符还是读为两个字符的问题,这时大家可能会想,很中文编码表一样解决不就行了?在首个字节的首个比特位做标记。可是这里不能这样,因为做了标记,我们不就少了一个比特位了吗,能够表示的字符数量就会减少。两个字节本来可以表示2的16次方个字符,现在使用第一个比特位做标记后,就只能表示2的15次方个字符了,用来表示全世界的字符就不够用了。

    这里可能大家第一个想到的就是,两个字节不够表示全世界的字符,那我们多加一个字节,最多用三个字节表示一个字符,还是用首个字节的首个比特位作为要读取几个字节的标识怎么样?这显然不行,首个比特位0表示读取一个字节,1表示读取两个字节,那现在一次要读取三个字节又该如何表示呢?

    在这里插入图片描述

    UTF-8用的是最多四个字节表示一个字符,0:读取一个字符;110:读取两个字符;1110:读取三个字符;11110:读取四个字符。

    展开全文
  • linux中,ssh界面中文字符乱码

    千次阅读 2012-06-30 17:23:44
    export LANG=c ...若不清楚当前系统支持哪些中文字符集,可以用“locale -a”查看当前系统支持的中文字符集,见下图: 对linux系统字符集的更改,两种方式,一种是只针对当前ssh客户端界面

    export LANG=c

     

    在使用redhat时,经常会遇到用ssh客户端去连接linux服务器,使用时,发现中文字符乱码。见下图:


    此时,用locale命令查看当前系统语言环境变量,见下图:

    若不清楚当前系统支持哪些中文字符集,可以用“locale -a”查看当前系统支持的中文字符集,见下图:


    对linux系统字符集的更改,有两种方式,一种是只针对当前ssh客户端界面有效,另一种是针对linux服务器有效,下面将分别予以介绍。

    第一种:仅针对当前ssh客户端界面有效。也可以理解为,ssh客户端重启,linux服务器重启都会使更改失效。

    达到这个目的,有两个方法:

    其一:LANG=zh_CN.gb18030

    其二:export LANG=zh_CN.gb18030

    第二种:修改对linux服务器有效。ssh客户端重启、linux服务器重启,原来的更改不会发生变化。

    此次,需要修改linux的一个配置文件i18n,位于/etc/sysconfig/目录中。见下图


    把文件中的LANG=zh_CN.UTF-8更改为LANG=zh_CN.gb18030即可。

    然后一步是使更改立即生效,有三种方法:

    1.立即重启linux操作系统

    2.source /etc/sysconfig/i18n

    3.或者“. /etc/sysconfig/i18n”


     说明:source命令,会忽略文件的执行权限,强制使文件中的命令立即生效,它就是来执行脚本文件的,很多情况下会用来让刚修改的脚本文件生效。另外,source命令还有个别名(可以这样理解),那就是点命令(.),即二者可以互换使用。

    在啰嗦下,linux中“.”有三种含义,其一:用在文件前表示隐藏,即表示是隐藏文件;其二:指当前目录;其三,就是本例中给出的点命令,与source通用。

    展开全文
  • 在计算机世界里,所有数据都使用二进制存储,即只有1和0,在人的世界里有中文/英文/阿拉伯文等,还有图片/视频/音频,如何使用二进制存储和显示它们呢?具体使用哪些二进制字符表示哪个符号的这样一种规则就叫...

    因为编码不对!

    什么是编码?编码不对为什么会乱码?

    ……??

    编码转换为什么会丢失数据?

    ……??

    不管是数据库还是网页,都可能碰到过乱码问题 

    在计算机世界里,所有数据都使用二进制存储,即只有1和0,在人的世界里有中文/英文/阿拉伯文等,还有图片/视频/音频,如何使用二进制存储和显示它们呢?具体使用哪些二进制字符表示哪个符号的这样一种规则就叫编码。编码充当着一个翻译的角色,计算机是美国人发明的,为了存储他们使用的语言abcd等26个英文字母以及常用的符号~!@#¥%……&*()-+,美国有关标准化组织出台了ASCII编码,但是,ASCII编码是单字节编码系统,最多只能表示256个字符,因此ASCII只适用于拉丁文字子母,而其他国家有各种各样的语言文字,比如中文字符有好几万个,于是有了GB2312双子节编码。

    GB2312适用于汉字处理、汉字通信等系统之间的信息交换,GB2312共收录6763个常用中文和非汉字图形字符682个,由中国国家标准总局于1980年发布,随着汉字标准的发展,GB2312收录的6千多字明显不够用了,1995年又发布了GBK编码,GBK是GB2312的扩展,向下兼容GB2312编码,GBK编码共收录了21003个汉字。

    观察ASCII会发现,ASCII编码只能表示寥寥256个字符,而GB2312共收录6千多个字符,假如想用ASCII编码来表示六千多个中文,很明显ASCII里面并没有与中文对应的映射关系,所以就显示乱码了。

    每个国家都有自己相应的编码规则,为了解决编码不统一的问题,Unicode编码方案应运而生。Unicode也叫统一码或万国码,它是计算机科学领域里的一项业界标准,Unicode把所有语言都统一到一套编码里,以满足跨语言、跨平台进行文本转换、处理的要求,这样就不会再有乱码问题了,它于1994年正式公布。UTF8就是Unicode编码方案的一种。

    UTF8的长度是1-4位(最初是1-6位),GB2312长度是2位,一个长度为3位的UTF8字符转换成GB2312就会丢失信息,显示乱码,再转换回UTF8也无济于事,因为信息已经丢失。这就是我们有时候在转换编码的时候乱码的原因。 

     

    作者:王美建
    出处:http://www.cnblogs.com/wangmeijian
    本文版权归作者和博客园所有,欢迎转载,转载请标明出处。
    如果您觉得本篇博文对您有所收获,请点击右下角的 [推荐],谢谢!

    转载于:https://www.cnblogs.com/wangmeijian/p/5374507.html

    展开全文
  • 那么,当前比较通用的字符集有哪些呢?它们都有些什么特点?它们之间有什么区别和联系?为什么字符集错位会导致出现中文问题呢?要回答这些问题,我们就要对字符集有一个系统的了解。网络上有一篇文章对此作了系统...
  • 字段类型 中文说明 限制条件 其它说明 CHAR 固定长度字符串 最大长度2000 bytes VARCHAR2 可变长度的字符串 最大长度4000 bytes 可做索引的最大长度749 NCHAR 根据字符集而定的...NVARCHAR2 根据字符集而定的可变长
  • 目录 插入中文失败 校对集问题(数据比较的方式) Web乱码 插入中文失败 ...中文数据问题本质就是字符集问题 ...计算机识别二进制:人类更多是识别符号:需要由两个二进制与字符的...1、查看服务器支持哪些字符集 ..
  • Oracle中有哪些数据类型

    千次阅读 2014-12-10 17:08:50
    字段类型 中文说明 限制条件 其它说明  CHAR 固定长度字符串 最大长度2000 bytes   VARCHAR2 可变长度的字符串 最大长度4000 bytes 可做索引的最大长度749  ... NVARCHAR2 根据字符集而定
  • C语言-转义字符

    千次阅读 2019-07-19 21:26:15
    那么,C语言转义字符都有哪些呢? 定义 参考C语言中文网上对转义字符的定义: 字符集(Character Set)为每个字符分配了唯一的编号,我们不妨将它称为编码值。在C语言中,一个字符除了可以用它的实体(也就是真正的...
  • 键入cmd或command(在命令行里可以看到系统版本、文件系统版本)chcp 修改默认字符集chcp 936默认中文chcp 650011. appwiz.cpl:程序和功能 2. calc:启动计算器 5. chkdsk.exe:Chkdsk磁盘检查(管理员身份运行...
  • 浅谈C/C++编程中的字符编码转换

    万次阅读 2017-03-02 15:11:48
    导致这种现象的根源就在于字符集编码不匹配导致,本文将探索隐藏在编程过程中鲜为人知的字符集转换问题,如果你彻底理解了以下几个字符集的概念,以及编程过程中哪些因素会影响这些字符集,将助于你从根
  • 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如...很多同学在打开数据时会遇上乱码问题,其原因是字符集的编码问题。Linux和Mac默认的编码集是UTF8,而Windows则是ASCII。如果
  • 采用统一编码UTF-8方式编码 1- 应用字符集的选择;所以对提供了多语言版本的网站来说,Unicode字符集应该是最理想的选择。... 所以在设计和开发多语言网站时,一定要注意先把非中文页面的字符集定义为“utf
  • mysql中文乱码总结

    2017-05-25 17:22:05
    介绍前先普及下mysql关于字符集有哪些变量,如下图: character_set_database : 数据库的字符集,即use databasename对应得数据库名字符集 character_set_server: 默认的内部操作字符集 ,创建一个数据库
  • MySQL中文显示乱码问题 ...先查一下,系统中有哪些地方的字符集不是utf-8 show variables like '%character%'; 修改mysql安装目录下配置项 # For advice on how to change settings please see #
  • MySQL中文乱码问题

    2017-02-03 09:17:09
    大圣网络 2017-01-27 07:58 估计许多新手在使用时都会遇到这个问题 ...首先,我们查看服务器到底识别哪些字符集,敲下指令 show characeter set; mysql支持的字符集 可以看到,mysql支持非常多的字符集
  • AIX上安装WebLogic的中文支持解决。

    千次阅读 2010-07-27 09:31:00
    起因:几个公司的项目组在一起工作,客户方的AIX机器安装好了oracle10g和...真的是太感谢了……   解决办法: 1、locale -a 查看系统支持哪些字符集,要求厂商安装中文字符集。 2、vi /etc/
  • 本人在使用ZKUI的过程中发现中文有乱码问题,在网上没有看见切实可行的解决方案,于是自己看了一下它的代码,检查了一下哪些地方应该使用字符集,将其逐个修正,亲测好使,有效。还有一个问题是根节点的属性导出之后...
  • 首先,你得查看一下,docker里面有哪些语言已经是安装好的了 查看容器支持的所有字符集 root@2dcb5ac17876:~/guns/project# locale -a locale: Cannot set LC_CTYPE to default locale: No such file or directory ...
  • MySQL中文参考手册

    2010-08-10 22:11:55
    9.1.1 用于数据和排序的字符集 9.1.2 增加一个新的字符集 9.1.3 多字节字符支持 9.2 更新日志 9.3 MySQL数据库表可以多大? 9.4 MySQL数据库表类型 10 从 MySQL 得到最大的性能 10.1 优化概述 10.2 系统/...
  • 疯狂java讲义第四章第一题

    千次阅读 2013-05-06 15:08:20
    package chapter04; /**** * 本帖最后由 kongyeeku 于 2012-3-11 23:02 编辑 ...1.习题要求能支持简体中文字符,所以你要考虑支持简体中文字符字符集有哪些? UNICODE、UTF-8、GBK、GB2312等等 2.习题要求你按
  • OpenGL 编程指南中文版(第四版).pdf

    千次下载 热门讨论 2010-09-08 14:56:35
    OpenGL 编程指南中文版(第四版),英文名《OpenGL Programming Guide Forth Edition,The Offical Guide to Learning OpenGl,Version 1.4》,作者:Dave Shreiner、Mason woo、Jackie Neider、Tom Davis,翻译:邓...
  • 为什么需要字符集 计算机存储的和认识的东西就是0和1,我们存储的任何东西最后都会转为0和1的...有哪些字符集 ANSI 最早字符集是ANSI编码(American Standard Code for Information Interchange,美国信息互换标准
  • 1.30如何判断哪些标识符可以使用,哪些被保留了? 初始化  1.31 对于没有显式初始化的变量的初始值可以作怎样的假定?如果一个全局变量初始值为“零”,它可否作为空指针或浮点零?  1.32 下面的代码为什么不能...
  • MySQL中文参考手册.chm

    热门讨论 2007-06-11 21:31:17
    9.1.1 用于数据和排序的字符集 9.1.2 增加一个新的字符集 9.1.3 多字节字符支持 9.2 更新日志 9.3 MySQL数据库表可以多大? 9.4 MySQL数据库表类型 10 从 MySQL 得到最大的...
  • 用于创建数据的 Visual Studio 工具:描述 Visual Studio 提供了哪些允许创建数据的功能,以及在何时选用什么样的工具。 用组件设计器创建类型化数据:描述在窗体或组件中工作时如何创建数据。 用表达式创建...
  • 本附录列出了ASCII字符集及其十进制、八进制、十六进制和二进制表示。 附录D:操作符优先级 本附录按优先级从高到低的顺序列出了C++的操作符。 附录E:其他操作符 本附录总结了正文中没有介绍的其他C++操作符,...

空空如也

空空如也

1 2 3 4 5 6
收藏数 103
精华内容 41
关键字:

中文字符集有哪些