-
GBK,UTF8是什么?
2016-09-07 16:15:31GBK是指汉字内码,简称'国标',主要是对中文的字符编码 UTF8是一种可变长度的字符编码,简称'万国码',被多个国家录入,只要用于多语言网站GBK是指汉字内码,简称'国标',主要是对中文的字符编码
UTF8是一种可变长度的字符编码,简称'万国码',被多个国家录入,只要用于多语言网站
-
GBK,UTF8是什么?
2014-02-21 09:59:50UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为...如,如果是UTF8编码,则在外国人的英文IE上也能显示UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。
GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。
GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:
GBK、GB2312--Unicode--UTF8
UTF8--Unicode--GBK、GB2312
对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。
个编码的区别详细解释简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与gbk就是不一样的,假设uncode为a040,gbk为b030,而uft-8码,就是把那个值表现的形式.utf-8码完全只针对uncode来组织的,如果GBK要转UTF-8必须先转uncode码,再转utf-8就OK了。
GBK,UTF8都是一种字符集,就是一种编码方式~ 字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同。GBK、UTF8是网络编程人员必须要了解的基础知识。
GBK包含全部中文字符,
UTF-8则包含全世界所有国家需要用到的字符。
GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。
比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。
所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。
UTF8能很好的兼容其他国语言,相同数据的数据库占用量是gbk的1.5倍,如果你的网站只面向中国用户,可以只用考虑选择简体版 -
MYSQL: set names utf8是什么意思?
2019-01-27 13:35:26set names utf8 是用于设置编码,可以再在建数据库的时候设置,也可以在创建表的时候设置,或只是对部分字段进行设置,而且在设置编码的时候,这些地方最好是一致的,这样能最大程度上避免数据记录出现乱码。...set names utf8 是用于设置编码,可以再在建数据库的时候设置,也可以在创建表的时候设置,或只是对部分字段进行设置,而且在设置编码的时候,这些地方最好是一致的,这样能最大程度上避免数据记录出现乱码。 执行SET NAMES utf8的效果等同于同时设定如下: SET character_set_client='utf8'; SET character_set_connection='utf8'; SET character_set_results='utf8'; 另外,如果数据出现乱码可以试着用以下办法解决: 一、避免创建数据库及表出现中文乱码和查看编码方法 1、创建数据库的时候:CREATE DATABASE `test` CHARACTER SET 'utf8' COLLATE 'utf8_general_ci'; 2、建表的时候 CREATE TABLE `database_user` ( `ID` varchar(40) NOT NULL default '', `UserID` varchar(40) NOT NULL default '', ) ENGINE=InnoDB DEFAULT CHARSET=utf8; 这3个设置好了,基本就不会出问题了,即建库和建表时都使用相同的编码格式。 如果是已经建了库和表可以通过以下方式进行查询。 1.查看默认的编码格式: mysql> show variables like "%char%"; +--------------------------+---------------+ | Variable_name | Value | +--------------------------+---------------+ | character_set_client | gbk | | character_set_connection | gbk | | character_set_database | utf8 | | character_set_filesystem | binary | | character_set_results | gbk | | character_set_server | utf8 | | character_set_system | utf8 | +--------------------------+-------------+ 注:以前2个来确定,可以使用set names utf8,set names gbk设置默认的编码格式;
-
SQL Server 中 Unicode与UTF8是什么概念
2013-03-31 01:35:37UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。unicode是一种编码方式,和ascii是同一个概念,而UTF是一种存储方式(格式)。 在jvm内部,虚拟机管理数据(内存里)时,或者在进行对象序列化...UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。unicode是一种编码方式,和ascii是同一个概念,而UTF是一种存储方式(格式)。 在jvm内部,虚拟机管理数据(内存里)时,或者在进行对象序列化的时候,字符(串)都是以unicode编码方式的。 但是在jvm中,字符(串)是以char 这种(存储)形式存放的,一个char占2个字节(例如可以定义char c='字'),就是“字”和“Z”是同样占2个字节的;而在对象序列化后,对象是进行UTF-8存储的,一个中文占2个字节,而英文、数字等只占一个字节。 所以导致系列化以后的对象只占平时的大约一半的空间(当全是中文时占用相同的空间;全是英文时unicode占用的空间是UTF-8的2倍)。
------------
http://wenku.baidu.com/view/cb9fe505cc17552707220865.html
unicode,ansi,utf-8,unicode big endian编码的区别_百度文库
-
GBK,GB2312,UTF8是什么?
2011-07-29 13:34:19UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文...UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强 -
Unicode,UTF8,UTF16,UTF32 是什么?它们有什么关系?
2019-09-22 15:41:34Unicode,UTF8,UTF16,UTF32 是什么?它们有什么关系? -
UTF-8 和UTF8和utf-8和utf8有什么区别 ?
2015-01-17 21:44:20“UTF-8”也可以把中间的“-”省略,写成“UTF8”。一般程序都能识别,但也有例外(如下文),为了严格一点,最好用标准的大写“UTF-8”。 在MySQL数据库中只能使用“utf8” 在MySQL的命令模式中只能使用... -
什么是Unicode是什么是UTF-8是什么
2009-12-02 16:16:00什么是Unicode是什么是UTF-8是什么 作者:匿名 来源:网上搜集 浏览次数:490 阅读权限:游客身份 花费金币:0 添加时间:2006-4-18 21:51:52 一直在编码方面要求不是很高,所以对Unicode和UTF-8也不甚了解。 最近偶然翻... -
python中utf-8是什么意思_python utf8什么意思
2021-02-03 10:09:35几谢谢你的耐心解答,虽然没有说什么,。哈哈这就是不兼容的代价回复@yak:刚刚看了DarkAngel朋友的回复,看了官网的介绍。自己没有英文的功底,借助百度翻译慢慢的拼接理解大概意思。现在看到了你的回复,方便很多,... -
utf-8 和 utf8 有什么区别
2018-02-05 14:19:49一般程序都能识别,但也有例外,在数据库中只能使用"utf8"(MySQL) 在MySQL的命令模式中只能使用"utf8",不能使用"utf-8",为了严格一点,最好用标准的大写"UTF-8"。 总结:【只有在MySQL中可 -
字符编码的概念(UTF-8、UTF-16、UTF-32都是什么鬼)
2017-11-30 17:11:56在编程过程中我们经常会使用字符,而使用字符的前提就是把字符放入内存中,毫无疑问,放入内存中的仅仅是字符的编号,而不是真正的字符实体。 这就抛出了一个问题,如何才能将字符编号放入内存中呢? 对于 ASCII... -
什么是Unicode是什么是UTF-8是什么
2006-12-18 16:45:00一直在编码方面要求不是很高,所以对Unicode和UTF-8也不甚了解。 最近偶然翻到一篇UTF-8的文章,感觉解释的非常繁杂,因此才想到重新写一篇简单易懂一点的。 首先说明一下现在常用的一些编码方案: 1、在中国,... -
python中utf-8是什么意思_python中Unicode和UTF-8的区别
2020-12-01 12:40:011,UTF-8在python的开始处,#coding:utf-8或者#coding=utf-8的作用一样,声明Python代码的文本格式是UTF-8,按照这种格式来读取程序。如下编写一个脚本:如果不添加#coding=utf-8,脚本有中文时程序会报错2,Unicode和... -
utf8 和 UTF-8 有什么区别
2015-05-12 18:32:37“UTF-8”也可以把中间的“-”省略,写成“UTF8”。一般程序都能识别,但也有例外(如下文),为了严格一点,最好用标准的大写“UTF-8”。 在MySQL数据库中只能使用“utf8” 在MySQL的命令模式中只能使用“utf8... -
utf 8无bom和utf 8什么区别
2019-08-10 16:25:39今天在上传CSV文件的时候,Windows下调试一切正常。妈的一到Linux下面,就出现问题,第一行数据总是读取不...在Windows下面,转码后的CSV的编码格式为以带BOM的UTF-8格式编码,在Linux下面不支持BOM,因此在notepa... -
collate utf8_bin是什么意思
2020-02-12 12:01:27创建数据库时 collate utf_bin是 以二进制值比较,也就是区分大小写,collate是核对的意思 uft-8_general_ci 一般比较,不区分大小写 -
Unicode是什么?UTF-8是什么?
2011-08-31 10:49:32Unicode和UTF-8在制作网页中对于很多人不是很了解,到底是什么样的概念希望通过本文可以让大家了解,首先说明一下现在常用的一些编码方案: 1、在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,... -
什么是 UTF-8
2007-03-21 22:59:00什么是 UTF-8什么是UTF8 UTF8并不算是一种电脑编码,而是一种储存和传送的格式,如前所述,每个Unicode/UCS字符都以 2或4个bytes来储存,看看以下的比较: 以"I am Chinese"为例 用ANSI储存:12 Bytes 用Unicode/... -
UTF-8的BOM是什么意思
2019-06-11 08:22:05BOM:byte order mark,定义字节顺序,因为网络传输中分为两种,大头和小头。uft-8不需要bom表明字节顺序,...微软在utf-8中使用bom是因为这样可以把UTF-8和ASCII等编码区分开来,但这样的文件在windows之外的操作系... -
UTF-8 是什么东东?
2009-10-22 16:19:00UTF-8 编码介绍UTF-8 编码是一种被广泛应用的编码,这种编码致力于把全球的语言纳入一个统一的编码,目前已经将几种亚洲语言纳入。UTF 代表 UCS Transformation Format.UTF-8 采用变长度字节来表示字符,理论上最多... -
Unicode是什么 UTF-8是什么 .
2012-06-27 17:09:051、在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系是这样的。 最早制定的汉字编码是GB2312,包括6763个汉字和682个其它符号 95年重新修订了编码,命名GBK1.0,共收录了... -
mysql中字符集 utf8 和utf8mb4 有什么区别?
2017-11-01 18:08:42本文讲的是mysql中字符集 utf8 和utf8mb4 有什么区别?, 可以简单的理解 utf8mb4 是目前最大的一个字符编码,支持任意文字. 为什么会有UTF8MB4? 既然utf8应付日常使用完全没有问题,那为什么还要使用utf8mb4呢? 低... -
Unicode是什么 UTF-8是什么
2007-10-17 08:29:00首先说明一下现在常用的一些编码方案: 1、在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系是这样的。最早制定的汉字编码是GB2312,包括6763个汉字和682个其它符号95年重新修订... -
什么时候该用utf-8,什么时候用utf8
2013-11-24 21:10:11在php.ini里面设置 default_charset = "utf8" //不能是”utf-8“ 在使用PDO时: $options = array(PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES 'utf8';"); //不能是”utf-8“ $pdo = PDO($dsn, $username, $passwd... -
Unicode是什么 UTF-8是什么
2007-03-19 10:02:00首先说明一下现在常用的一些编码方案: 1、在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系是这样的。最早制定的汉字编码是GB2312,包括6763个汉字和682个其它符号95年重新修订...
收藏数
13,978
精华内容
5,591