精华内容
下载资源
问答
  • GBK,UTF8是什么?

    2016-09-07 16:15:31
    GBK是指汉字内码,简称'国标',主要是对中文的字符编码 UTF8是一种可变长度的字符编码,简称'万国码',被多个国家录入,只要用于多语言网站

    GBK是指汉字内码,简称'国标',主要是对中文的字符编码

    UTF8是一种可变长度的字符编码,简称'万国码',被多个国家录入,只要用于多语言网站

    展开全文
  • GBK,UTF8是什么?

    2014-02-21 09:59:50
    UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为...如,如果是UTF8编码,则在外国人的英文IE上也能显示
    UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。

    GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。

    GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

    GBK、GB2312--Unicode--UTF8

    UTF8--Unicode--GBK、GB2312

    对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。
    个编码的区别详细解释

    简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与gbk就是不一样的,假设uncode为a040,gbk为b030,而uft-8码,就是把那个值表现的形式.utf-8码完全只针对uncode来组织的,如果GBK要转UTF-8必须先转uncode码,再转utf-8就OK了。

    GBK,UTF8都是一种字符集,就是一种编码方式~ 字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同。GBK、UTF8是网络编程人员必须要了解的基础知识。

    GBK包含全部中文字符,
    UTF-8则包含全世界所有国家需要用到的字符。

    GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)

    UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。
    比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 

    所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。
    UTF8能很好的兼容其他国语言,相同数据的数据库占用量是gbk的1.5倍,如果你的网站只面向中国用户,可以只用考虑选择简体版

    展开全文
  • MYSQL: set names utf8是什么意思?

    千次阅读 2019-01-27 13:35:26
    set names utf8 用于设置编码,可以再在建数据库的时候设置,也可以在创建表的时候设置,或只是对部分字段进行设置,而且在设置编码的时候,这些地方最好一致的,这样能最大程度上避免数据记录出现乱码。...
    set names utf8 是用于设置编码,可以再在建数据库的时候设置,也可以在创建表的时候设置,或只是对部分字段进行设置,而且在设置编码的时候,这些地方最好是一致的,这样能最大程度上避免数据记录出现乱码。
    
    执行SET NAMES utf8的效果等同于同时设定如下:
    SET character_set_client='utf8';
    SET character_set_connection='utf8';
    SET character_set_results='utf8';
    
    另外,如果数据出现乱码可以试着用以下办法解决:
    一、避免创建数据库及表出现中文乱码和查看编码方法
    1、创建数据库的时候:CREATE DATABASE `test`
    CHARACTER SET 'utf8'
    COLLATE 'utf8_general_ci';
    2、建表的时候 CREATE TABLE `database_user` (
    `ID` varchar(40) NOT NULL default '',
    `UserID` varchar(40) NOT NULL default '',
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
    
    这3个设置好了,基本就不会出问题了,即建库和建表时都使用相同的编码格式。
    如果是已经建了库和表可以通过以下方式进行查询。
    1.查看默认的编码格式:
    mysql> show variables like "%char%";
    +--------------------------+---------------+
    | Variable_name | Value |
    +--------------------------+---------------+
    | character_set_client | gbk |
    | character_set_connection | gbk |
    | character_set_database | utf8 |
    | character_set_filesystem | binary |
    | character_set_results | gbk |
    | character_set_server | utf8 |
    | character_set_system | utf8 |
    +--------------------------+-------------+
    注:以前2个来确定,可以使用set names utf8,set names gbk设置默认的编码格式;
    展开全文
  • SQL Server 中 Unicode与UTF8是什么概念

    千次阅读 2013-03-31 01:35:37
    UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。unicode一种编码方式,和ascii同一个概念,而UTF是一种存储方式(格式)。 在jvm内部,虚拟机管理数据(内存里)时,或者在进行对象序列化...
    UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。unicode是一种编码方式,和ascii是同一个概念,而UTF是一种存储方式(格式)。
          在jvm内部,虚拟机管理数据(内存里)时,或者在进行对象序列化的时候,字符(串)都是以unicode编码方式的。
            但是在jvm中,字符(串)是以char 这种(存储)形式存放的,一个char占2个字节(例如可以定义char c='字'),就是“字”和“Z”是同样占2个字节的;而在对象序列化后,对象是进行UTF-8存储的,一个中文占2个字节,而英文、数字等只占一个字节。
         所以导致系列化以后的对象只占平时的大约一半的空间(当全是中文时占用相同的空间;全是英文时unicode占用的空间是UTF-8的2倍)。
    ------------
    http://wenku.baidu.com/view/cb9fe505cc17552707220865.html
    

    unicode,ansi,utf-8,unicode big endian编码的区别_百度文库

    
    
    展开全文
  • GBK,GB2312,UTF8是什么?

    2011-07-29 13:34:19
    UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文...UTF-8包含全世界所有国家需要用到的字符,国际编码,通用性强
  • Unicode,UTF8,UTF16,UTF32 是什么?它们有什么关系?
  • UTF-8 和UTF8和utf-8和utf8什么区别 ?

    千次阅读 2015-01-17 21:44:20
    “UTF-8”也可以把中间的“-”省略,写成“UTF8”。一般程序都能识别,但也有例外(如下文),为了严格一点,最好用标准的大写“UTF-8”。 在MySQL数据库中只能使用“utf8”  在MySQL的命令模式中只能使用...
  • 什么是Unicode是什么是UTF-8是什么 作者:匿名 来源:网上搜集 浏览次数:490 阅读权限:游客身份 花费金币:0 添加时间:2006-4-18 21:51:52 一直在编码方面要求不是很高,所以对Unicode和UTF-8也不甚了解。 最近偶然翻...
  • 几谢谢你的耐心解答,虽然没有说什么,。哈哈这就是不兼容的代价回复@yak:刚刚看了DarkAngel朋友的回复,看了官网的介绍。自己没有英文的功底,借助百度翻译慢慢的拼接理解大概意思。现在看到了你的回复,方便很多,...
  • utf-8 和 utf8什么区别

    千次阅读 2018-02-05 14:19:49
    一般程序都能识别,但也有例外,在数据库中只能使用"utf8"(MySQL) 在MySQL的命令模式中只能使用"utf8",不能使用"utf-8",为了严格一点,最好用标准的大写"UTF-8"。 总结:【只有在MySQL中可
  • 字符编码的概念(UTF-8UTF-16、UTF-32都是什么鬼)

    万次阅读 多人点赞 2017-11-30 17:11:56
    在编程过程中我们经常会使用字符,而使用字符的前提就是把字符放入内存中,毫无疑问,放入内存中的仅仅字符的编号,而不是真正的字符实体。 这就抛出了一个问题,如何才能将字符编号放入内存中呢? 对于 ASCII...
  • 什么是Unicode是什么是UTF-8是什么

    千次阅读 2006-12-18 16:45:00
    一直在编码方面要求不是很高,所以对Unicode和UTF-8也不甚了解。 最近偶然翻到一篇UTF-8的文章,感觉解释的非常繁杂,因此才想到重新写一篇简单易懂一点的。 首先说明一下现在常用的一些编码方案: 1、在中国,...
  • 1,UTF-8在python的开始处,#coding:utf-8或者#coding=utf-8的作用一样,声明Python代码的文本格式是UTF-8,按照这种格式来读取程序。如下编写一个脚本:如果不添加#coding=utf-8,脚本有中文时程序会报错2,Unicode和...
  • “UTF-8”也可以把中间的“-”省略,写成“UTF8”。一般程序都能识别,但也有例外(如下文),为了严格一点,最好用标准的大写“UTF-8”。 在MySQL数据库中只能使用“utf8”  在MySQL的命令模式中只能使用“utf8...
  • 今天在上传CSV文件的时候,Windows下调试一切正常。妈的一到Linux下面,就出现问题,第一行数据总是读取不...在Windows下面,转码后的CSV的编码格式为以带BOM的UTF-8格式编码,在Linux下面不支持BOM,因此在notepa...
  • 创建数据库时 collate utf_bin 以二进制值比较,也就是区分大小写,collate核对的意思 uft-8_general_ci 一般比较,不区分大小写
  • Unicode是什么?UTF-8是什么

    千次阅读 2011-08-31 10:49:32
    Unicode和UTF-8在制作网页中对于很多人不是很了解,到底是什么样的概念希望通过本文可以让大家了解,首先说明一下现在常用的一些编码方案:  1、在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,...
  • 什么是 UTF-8

    千次阅读 2007-03-21 22:59:00
    什么是 UTF-8什么是UTF8 UTF8并不算是一种电脑编码,而是一种储存和传送的格式,如前所述,每个Unicode/UCS字符都以 2或4个bytes来储存,看看以下的比较: 以"I am Chinese"为例 用ANSI储存:12 Bytes 用Unicode/...
  • UTF-8的BOM是什么意思

    千次阅读 2019-06-11 08:22:05
    BOM:byte order mark,定义字节顺序,因为网络传输中分为两种,大头和小头。uft-8不需要bom表明字节顺序,...微软在utf-8中使用bom因为这样可以把UTF-8和ASCII等编码区分开来,但这样的文件在windows之外的操作系...
  • UTF-8 是什么东东?

    2009-10-22 16:19:00
    UTF-8 编码介绍UTF-8 编码一种被广泛应用的编码,这种编码致力于把全球的语言纳入一个统一的编码,目前已经将几种亚洲语言纳入。UTF 代表 UCS Transformation Format.UTF-8 采用变长度字节来表示字符,理论上最多...
  • Unicode是什么 UTF-8是什么 .

    千次阅读 2012-06-27 17:09:05
     1、在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系这样的。 最早制定的汉字编码GB2312,包括6763个汉字和682个其它符号 95年重新修订了编码,命名GBK1.0,共收录了...
  • 本文讲的mysql中字符集 utf8utf8mb4 有什么区别?, 可以简单的理解 utf8mb4 目前最大的一个字符编码,支持任意文字. 为什么会有UTF8MB4? 既然utf8应付日常使用完全没有问题,那为什么还要使用utf8mb4呢? 低...
  • 首先说明一下现在常用的一些编码方案: 1、在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系这样的。最早制定的汉字编码GB2312,包括6763个汉字和682个其它符号95年重新修订...
  • 在php.ini里面设置 default_charset = "utf8" //不能”utf-8“ 在使用PDO时: $options = array(PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES 'utf8';"); //不能”utf-8“ $pdo = PDO($dsn, $username, $passwd...
  • Unicode是什么 UTF-8是什么

    千次阅读 2007-03-19 10:02:00
    首先说明一下现在常用的一些编码方案: 1、在中国,大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系这样的。最早制定的汉字编码GB2312,包括6763个汉字和682个其它符号95年重新修订...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 13,978
精华内容 5,591
关键字:

utf8是什么