精华内容
下载资源
问答
  • mysql里中文多少个字节?1. 一个中文汉字占多少字节与编码有关:UTF8:一个中文汉字=3个字节GBK:一个中文汉字=2个字节utf-8, 英文字母1字节2.varchar(n)能存储几个汉字?varchar(n)表示n个字符,...

    在mysql中,一个中文汉字所占的字节数与编码格式有关:如果是GBK编码,则一个中文汉字占2个字节;如果是UTF8编码,则一个中文汉字占3个字节,而英文字母占1字节。

    58d903d3de7ab7c495c906f23a04ffbc.png

    mysql里中文占多少个字节?

    1. 一个中文汉字占多少字节与编码有关:UTF8:一个中文汉字=3个字节

    GBK:一个中文汉字=2个字节utf-8, 英文字母1字节

    2.varchar(n)能存储几个汉字?

    varchar(n)表示n个字符,无论汉字和英文,Mysql都能存入n个字符,仅是实际字节长度有所区别

    3.MySQL怎么检查长度(占的字节数)?

    可用SQL语言中length函数:select LENGTH(fieldname) from tablename

    说明:

    UTF-8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。

    GBK 是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。

    GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

    GBK、GB2312-->Unicode-->UTF8

    UTF8-->Unicode-->GBK、GB2312GB2312是GBK的子集,GBK是GB18030的子集

    GBK是包括中日韩字符的大字符集合

    为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便

    UTF8可以看作是大字符集,它包含了大部分文字的编码。

    使用UTF8的一个好处是其他地区的用户(如香港台湾)无需安装简体中文支持就能正常观看你的文字而不会出现乱码。

    总结:gb2312是简体中文的码

    gbk支持简体中文及繁体中文

    big5支持繁体中文

    utf8支持几乎所有字符

    推荐教程:mysql视频教程

    展开全文
  • utf-8中三: 引用: 英文字母: 字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK 字节数 : 1;编码:GB18030 字节数 : 1;编码:ISO-8859-1 字节数 : 1;编码:UTF-8 字节数 : 4;编码:UTF-16 字节数 : 2;...

    utf-8中三个:

    引用:

    英文字母:

    字节数 : 1;编码:GB2312

    字节数 : 1;编码:GBK

    字节数 : 1;编码:GB18030

    字节数 : 1;编码:ISO-8859-1

    字节数 : 1;编码:UTF-8

    字节数 : 4;编码:UTF-16

    字节数 : 2;编码:UTF-16BE

    字节数 : 2;编码:UTF-16LE

     

    中文汉字:

    字节数 : 2;编码:GB2312

    字节数 : 2;编码:GBK

    字节数 : 2;编码:GB18030

    字节数 : 1;编码:ISO-8859-1

    字节数 : 3;编码:UTF-8

    字节数 : 4;编码:UTF-16

    字节数 : 2;编码:UTF-16BE

    字节数 : 2;编码:UTF-16LE

    这是个好问题,可以当作一个笔试题。先从字符编码讲起。 1、美国人首先对其英文字符进行了编码,也就是最早的ascii码,用一个字节的低7位来表示英文的128个字符,高1位统一为0; 2、后来欧洲人发现尼玛你这128位哪够用,比如我高贵的法国人字母上面的还有注音符,这个怎么区分,得,把高1位编进来吧,这样欧洲普遍使用一个全字节进行编码,最多可表示256位。欧美人就是喜欢直来直去,字符少,编码用得位数少; 3、但是即使位数少,不同国家地区用不同的字符编码,虽然0--127表示的符号是一样的,但是128--255这一段的解释完全乱套了,即使2进制完全一样,表示的字符完全不一样,比如135在法语,希伯来语,俄语编码中完全是不同的符号; 4、更麻烦的是,尼玛这电脑高科技传到中国后,中国人发现我们有10万多个汉字,你们欧美这256字塞牙缝都不够。于是就发明了GB2312这些汉字编码,典型的用2个字节来表示绝大部分的常用汉字,最多可以表示65536个汉字字符,这样就不难理解有些汉字你在新华字典里查得到,但是电脑上如果不处理一下你是显示不出来的了吧。 5、这下各用各的字符集编码,这世界咋统一?俄国人发封email给中国人,两边字符集编码不同,尼玛显示都是乱码啊。为了统一,于是就发明了unicode,将世界上所有的符号都纳入其中,每一个符号都给予一个独一无二的编码,现在unicode可以容纳100多万个符号,每个符号的编码都不一样,这下可统一了,所有语言都可以互通,一个网页页面里可以同时显示各国文字。 6、然而,unicode虽然统一了全世界字符的二进制编码,但没有规定如何存储啊,亲。x86和amd体系结构的电脑小端序和大端序都分不清,别提计算机如何识别到底是unicode还是acsii了。如果Unicode统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有二到三个字节是0,文本文件的大小会因此大出二三倍,这对于存储来说是极大的浪费。这样导致一个后果:出现了Unicode的多种存储方式。 7、互联网的兴起,网页上要显示各种字符,必须统一啊,亲。utf-8就是Unicode最重要的实现方式之一。另外还有utf-16utf-32等。UTF-8不是固定字长编码的,而是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。这是种比较巧妙的设计,如果一个字节的第一位是0,则这个字节单独就是一个字符;如果第一位是1,则连续有多少个1,就表示当前字符占用多少个字节。 8、注意unicode的字符编码和utf-8的存储编码表示是不同的,例如"严"字的Unicode码是4E25,UTF-8编码是E4B8A5,这个7里面解释了的,UTF-8编码不仅考虑了编码,还考虑了存储,E4B8A5是在存储识别编码的基础上塞进了4E25。 9、UTF-8 使用一至四个字节为每个字符编码。128 个 ASCII 字符(Unicode 范围由 U+0000 至 U+007F)只需一个字节,带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语希伯来文阿拉伯文、叙利亚文及马尔代夫语(Unicode 范围由 U+0080 至 U+07FF)需要二个字节,其他基本多文种平面(BMP)中的字符(CJK属于此类-Qieqie注)使用三个字节,其他 Unicode 辅助平面的字符使用四字节编码。  10、最后,要回答你的问题,常规来看,中文汉字在utf-8中到底占几个字节,一般是3个字节,最常见的编码方式是1110xxxx 10xxxxxx 10xxxxxx。

     

    展开全文
  • 编码:UTF-8 字节数 : 4;编码:UTF-16 字节数 : 2;编码:UTF-16BE 字节数 : 2;编码:UTF-16LE 中文汉字: 字节数 : 2;编码:GB2312 字节数 : 2;编码:GBK 字节数 : 2;编码:GB18030 字节数 : 1;编码:ISO-8859-

    英文字母和中文汉字在不同字符集编码下的字节数
    英文字母:

    字节数 : 1;编码:GB2312

    字节数 : 1;编码:GBK

    字节数 : 1;编码:GB18030

    字节数 : 1;编码:ISO-8859-1

    字节数 : 1;编码:UTF-8

    字节数 : 4;编码:UTF-16

    字节数 : 2;编码:UTF-16BE

    字节数 : 2;编码:UTF-16LE

    中文汉字:

    字节数 : 2;编码:GB2312

    字节数 : 2;编码:GBK

    字节数 : 2;编码:GB18030

    字节数 : 1;编码:ISO-8859-1

    字节数 : 3;编码:UTF-8

    字节数 : 4;编码:UTF-16

    字节数 : 2;编码:UTF-16BE

    字节数 : 2;编码:UTF-16LE

    展开全文
  • mysql里中文多少个字节?1. 一个中文汉字占多少字节与编码有关:UTF8:一个中文汉字=3个字节GBK:一个中文汉字=2个字节utf-8, 英文字母1字节2.varchar(n)能存储几个汉字?varchar(n)表示n个字符,...

    在mysql中,一个中文汉字所占的字节数与编码格式有关:如果是GBK编码,则一个中文汉字占2个字节;如果是UTF8编码,则一个中文汉字占3个字节,而英文字母占1字节。

    671673af36715e805386ca43150329c3.png

    mysql里中文占多少个字节?

    1. 一个中文汉字占多少字节与编码有关:

    UTF8:一个中文汉字=3个字节

    GBK:一个中文汉字=2个字节

    utf-8, 英文字母1字节

    2.varchar(n)能存储几个汉字?

    varchar(n)表示n个字符,无论汉字和英文,Mysql都能存入n个字符,仅是实际字节长度有所区别

    3.MySQL怎么检查长度(占的字节数)?

    可用SQL语言中length函数:

    select LENGTH(fieldname) from tablename

    说明:

    UTF-8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。

    GBK 是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。

    GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

    GBK、GB2312-->Unicode-->UTF8

    UTF8-->Unicode-->GBK、GB2312

    GB2312是GBK的子集,GBK是GB18030的子集

    GBK是包括中日韩字符的大字符集合

    为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便

    UTF8可以看作是大字符集,它包含了大部分文字的编码。

    使用UTF8的一个好处是其他地区的用户(如香港台湾)无需安装简体中文支持就能正常观看你的文字而不会出现乱码。

    总结:

    gb2312是简体中文的码

    gbk支持简体中文及繁体中文

    big5支持繁体中文

    utf8支持几乎所有字符

    推荐教程:mysql视频教程

    展开全文
  • mysql里中文多少个字节?1. 一个中文汉字占多少字节与编码有关:UTF8:一个中文汉字=3个字节GBK:一个中文汉字=2个字节utf-8, 英文字母1字节2.varchar(n)能存储几个汉字?varchar(n)表示n个字符,...
  • mysql里中文多少个字节?1. 一个中文汉字占多少字节与编码有关:UTF8:一个中文汉字=3个字节GBK:一个中文汉字=2个字节utf-8, 英文字母1字节2.varchar(n)能存储几个汉字?varchar(n)表示n个字符,...
  • + range(0x2B740, 0x2B820) + range(0xF900, 0xFB00) + range(0x2F800, 0x2FA20) + range(0x9FA6, 0x9FCC)) 但请注意,此集包含超过75000字符,因此它可能不是最紧凑或最有效的数据结构. 此外,如果您坚持在文字字符...
  • 当我上第一节计算机课的时候,我的电脑老师跟我说,一个英文字符是1个字节,一个中文是2个字节。这么多年来,我对此一直坚信不移,相信很多人也是这么觉得的,但是,真实情况下是这么一回事么?要了解这个问题,我们...
  • 如果是utf8字符集下,一个中文汉字占3个字节数;如果是gbk字符集下,一个中文汉字占2个字节数。(推荐教程:mysql视频教程)mysql各字符集下汉字和字母占字节数varchar(N), 这里的N是指字符数,并不是字节数.占用的...
  • 如果是utf8字符集下,一个中文汉字占3个字节数;如果是gbk字符集下,一个中文汉字占2个字节数。(推荐教程:mysql视频教程)mysql各字符集下汉字和字母占字节数varchar(N), 这里的N是指字符数,并不是字节数.占用的...
  • Lua utf8中文字符数和子串截取

    千次阅读 2017-06-18 18:19:24
    utf8 中文字符的大小(占多少个字节utf8 字符串的长度 utf8 获取字符串的子串 测试example 1: utf8 字符规律字符串的首个byte表示了该utf8字符的长度 utf8单个字符可以有4种字节来存储:1个字节,2个字节,3个...
  • “1位”表示为1bit“1个字节”表示为1Byte“1个字节”=“8位” 即1Bytes=8bit因此“4个字节”=4*8位=32位此外,字母用用1个字节(即8位)...utf-8中文字符占三个字节,GB18030兼容GBK兼容GB2312中文字符占两个字节 ...
  • 一个汉字占多少个字节

    千次阅读 2020-07-01 20:54:04
    一个汉字占多少个字节 不同编码方式1个英文字母占的字节是不同的: 1,ASCII码:一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。 2,UTF-8编码:一个英文字符等于一个字节,一个中文...
  • 如果是utf8字符集下,一个中文汉字占3个字节数;如果是gbk字符集下,一个中文汉字占2个字节数。mysql各字符集下汉字和字母占字节数varchar(N), 这里的N是指字符数,并不是字节数.占用的字节数与编码有关在mysql ...
  • 如果是utf8字符集下,一个中文汉字占3个字节数;如果是gbk字符集下,一个中文汉字占2个字节数。mysql各字符集下汉字和字母占字节数varchar(N), 这里的N是指字符数,并不是字节数.占用的字节数与编码有关在mysql ...
  • 一个汉字占多少长度与编码有关:UTF8:一个汉字=3个字节GBK:一个汉字=2个字节2.varchar(n)表示n个字符,无论汉字和英文,Mysql都能存入n个字符,仅是实际字节长度有所区别3.MySQL检查长度,可用SQL语言:select...
  • 一个汉字占多少长度与编码有关:UTF8:一个汉字=3个字节GBK:一个汉字=2个字节2.varchar(n)表示n个字符,无论汉字和英文,Mysql都能存入n个字符,仅是实际字节长度有所区别3.MySQL检查长度,可用SQL语言:select...
  • 一个汉字到底是多少个字符 不同的字符所占的字节是不同的。 ASCII码: 一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。 一个二进制数字序列,在计算机中作为一个数字单元,一般为8...
  • 如果是utf8字符集下,一个中文汉字占3个字节数;如果是gbk字符集下,一个中文汉字占2个字节数。 mysql各字符集下汉字和字母占字节数 varchar(N), 这里的N是指字符数,并不是字节数.占用的字节数与编码有关 在...
  • Oracle 一个中文汉字 占用几个字节,要根据Oracle中字符集编码决定 查看oracle server端字符集   select userenv('language') from dual;   如果显示SIMPLIFIED CHINESE_CHINA.ZHS16GBK,一个汉字占用两个字节...
  • 如果是utf8字符集下,一个中文汉字占3个字节数;如果是gbk字符集下,一个中文汉字占2个字节数。mysql各字符集下汉字和字母占字节数varchar(N), 这里的N是指字符数,并不是字节数.占用的字节数与编码有关在mysql ...
  • 例子,在oracle中用utf8 字段中文长度为1的话,需要char(3),mysql中则是char(1),如果你按照oracle的做法去创建mysql字段,是不是在mysql表中创建的长度大小与自己锁想的不一样呢,所以这小知识点还是有必要...
  • Java基本数据类型所占字节数以及一个字符串怎么判断有多少个字节? 解答第一个问题,Java基本数据类型所占字节数 一个字符串判断有多少个字节组成: String采用一种更灵活的方式进行存储。在String中,一个英文...
  • 刚做了一个小案例的时候,发现需要对字符串... 测试: varchar(32)能存储多少个中文,英文及其他字符? 测试代码如下: var_dump(mb_strlen('你好吗aa','utf8'));//int(5) var_dump(mb_strlen('你好吗aa'));//int(11
  • 转自:http://www.oicto.com/mysql-utf8-length-char-varchar/ 只适用mysql5.0以上的版本:  1.一个汉字占多少长度与编码有关:  UTF-8:一个汉字=3个字节  GBK:一个汉字=2个字节  2.varchar(n)表示n...
  • 在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大 小。...

空空如也

空空如也

1 2 3 4 5 ... 9
收藏数 162
精华内容 64
关键字:

utf8中文多少个字节