精华内容
下载资源
问答
  • 如果是utf-8编码,那么一个中文包含繁体等于三个字节,一个英文字符等于一个字节。如果是gbk编码,那么一个中文包含繁体等于两个字节,一个英文字符等于一个字节。(推荐学习:Python入门教程)我们可以用如下方法...

    如果是utf-8编码,那么一个中文字符占用三个字节,一个英文字符占用一个字节。如果是gbk编码,那么一个中文字符占用两个字节,一个英文字符占用一个字节。

    如果是utf-8编码,那么一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。

    如果是gbk编码,那么一个中文包含繁体字等于两个字节,一个英文字符等于一个字节。

    (推荐学习:Python入门教程)

    我们可以用如下方法来判断:

    中文和符号:print(type('中文'.encode('utf-8')))  #输出为bytes类型

    执行结果:

    print(type('中文'.encode('gbk')))

    执行结果:

    print(len('中文'.encode('utf-8')))  #输出几个字节

    执行结果:

    6

    print(len('中文'.encode('gbk')))

    执行结果:

    4

    print(len(',。'.encode('gbk')))

    执行结果:

    4

    英文字母和符号:print(type('ab'.encode('utf-8')))

    执行结果:

    print(len('ab'.encode('utf-8')))

    执行结果:

    2

    print(len(',.'.encode('gbk')))

    执行结果:

    2

    展开全文
  • 如果是utf-8编码,那么一个中文包含繁体等于三个字节,一个英文字符等于一个字节。如果是gbk编码,那么一个中文包含繁体等于两个字节,一个英文字符等于一个字节。我们可以用如下方法来判断:中文和符号:print...

    如果是utf-8编码,那么一个中文字符占用三个字节,一个英文字符占用一个字节。如果是gbk编码,那么一个中文字符占用两个字节,一个英文字符占用一个字节。

    如果是utf-8编码,那么一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。

    如果是gbk编码,那么一个中文包含繁体字等于两个字节,一个英文字符等于一个字节。

    我们可以用如下方法来判断:

    中文和符号:print(type('中文'.encode('utf-8'))) #输出为bytes类型

    执行结果:

    print(type('中文'.encode('gbk')))

    执行结果:

    print(len('中文'.encode('utf-8'))) #输出几个字节

    执行结果:

    6

    print(len('中文'.encode('gbk')))

    执行结果:

    4

    print(len(',。'.encode('gbk')))

    执行结果:

    4

    英文字母和符号:print(type('ab'.encode('utf-8')))

    执行结果:

    print(len('ab'.encode('utf-8')))

    执行结果:

    2

    print(len(',.'.encode('gbk')))

    执行结果:

    2

    展开全文
  • utf-8的编码规则: 如果一个字节,最高位为0,表示这是一个ASCII字符(00~7F)如果一个字节,以11开头,连续...一个utf8数字1个字节 一个utf8英文字母1个字节 少数是汉字每个占用3个字节,多数占用4个字节。 ...

    utf-8的编码规则:

    如果一个字节,最高位为0,表示这是一个ASCII字符(00~7F)
    如果一个字节,以11开头,连续的1的个数暗示这个字符的字节数

    一个utf8数字占1个字节

    一个utf8英文字母占1个字节

    少数是汉字每个占用3个字节,多数占用4个字节。

    展开全文
  • 英文字母和中文汉字在不同字符集编码下的字节数英文字母:·字节数 : 1;编码:GB2312字节数 : 1;编码:GBK字节数 : 1;编码:GB18030字节数 : 1;编码:ISO-8859-1字节数 : 1;编码:UTF-8字节数 : 4;编码:UTF-16字节...

    英文字母和中文汉字在不同字符集编码下的字节数

    英文字母:

    ·字节数 : 1;编码:GB2312

    字节数 : 1;编码:GBK

    字节数 : 1;编码:GB18030

    字节数 : 1;编码:ISO-8859-1

    字节数 : 1;编码:UTF-8

    字节数 : 4;编码:UTF-16

    字节数 : 2;编码:UTF-16BE

    字节数 : 2;编码:UTF-16LE

    中文汉字:

    字节数 : 2;编码:GB2312

    字节数 : 2;编码:GBK

    字节数 : 2;编码:GB18030

    字节数 : 1;编码:ISO-8859-1

    字节数 : 3;编码:UTF-8

    字节数 : 4;编码:UTF-16

    字节数 : 2;编码:UTF-16BE

    字节数 : 2;编码:UTF-16LE

    美国人首先对其英文字符进行了编码,也就是最早的ascii码,用一个字节的低7位来表示英文的128个字符,高1位统一为0;

    后来欧洲人发现你这128位哪够用,比如法国人字母上面的还有注音符,这个怎么区分,于是把高1位编进来吧,这样欧洲普遍使用一个全字节进行编码,最多可表示256位。

    但是即使位数少,不同国家地区用不同的字符编码,虽然0–127表示的符号是一样的,但是128–255这一段的解释完全乱套了,即使2进制完全一样,表示的字符完全不一样,比如135在法语,希伯来语,俄语编码中完全是不同的符号;

    更麻烦的是,这编码传到中国后,中国人发现我们有10万多个汉字,你们欧美这256字塞牙缝都不够。于是就发明了GB2312这些汉字编码,典型的用2个字节来表示绝大部分的常用汉字,最多可以表示65536个汉字字符,这样就不难理解有些汉字你在新华字典里查得到,但是电脑上如果不处理一下你是显示不出来的了吧。

    这下各用各的字符集编码,这世界咋统一?俄国人发封email给中国人,两边字符集编码不同,尼玛显示都是乱码啊。为了统一,于是就发明了unicode,将世界上所有的符号都纳入其中,每一个符号都给予一个独一无二的编码,现在unicode可以容纳100多万个符号,每个符号的编码都不一样,这下可统一了,所有语言都可以互通,一个网页页面里可以同时显示各国文字。

    然而,unicode虽然统一了全世界字符的二进制编码,但没有规定如何存储啊。x86和amd体系结构的电脑小端序和大端序都分不清,别提计算机如何识别到底是unicode还是acsii了。如果Unicode统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有二到三个字节是0,文本文件的大小会因此大出二三倍,这对于存储来说是极大的浪费。这样导致一个后果:出现了Unicode的多种存储方式。

    互联网的兴起,网页上要显示各种字符,必须统一。utf-8就是Unicode最重要的实现方式之一。另外还有utf-16、utf-32等。UTF-8不是固定字长编码的,而是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。这是种比较巧妙的设计,如果一个字节的第一位是0,则这个字节单独就是一个字符;如果第一位是1,则连续有多少个1,就表示当前字符占用多少个字节。

    注意unicode的字符编码和utf-8的存储编码表示是不同的,例如”严”字的Unicode码是4E25,UTF-8编码是E4B8A5,这个7里面解释了的,UTF-8编码不仅考虑了编码,还考虑了存储,E4B8A5是在存储识别编码的基础上塞进了4E25。

    UTF-8 使用一至四个字节为每个字符编码。128 个 ASCII 字符(Unicode 范围由 U+0000 至 U+007F)只需一个字节,带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及马尔代夫语(Unicode 范围由 U+0080 至 U+07FF)需要二个字节,其他基本多文种平面(BMP)中的字符(CJK属于此类-Qieqie注)使用三个字节,其他 Unicode 辅助平面的字符使用四字节编码。

    所以知道utf-8的中文是一个字符占几个字节了吧?

    展开全文
  • 1,ASCII码:一个英文字母(不分大小写)个字节的空间,一个中文汉字两个度节的空间。 2,UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节中文标点个字节,英文标点个字节...
  • 英文字母和中文汉字在不同字符集编码下的字节数 英文字母: 字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK 字节数 : 1;编码:GB18030 字节数 : 1;编码:ISO-8859-1 字节数 : 1;编码:UTF-8 字节数 : 4;编码...
  • 在mysql中,一个中文汉字所的字节数...1. 一个中文汉字多少字节与编码有关:UTF8:一个中文汉字=3个字节GBK:一个中文汉字=2个字节utf-8, 英文字母1字节2.varchar(n)能存储几个汉字?varchar(n)表示n个字符,...
  • 在mysql中,一个中文汉字所的字节数...1. 一个中文汉字多少字节与编码有关:UTF8:一个中文汉字=3个字节GBK:一个中文汉字=2个字节utf-8, 英文字母1字节2.varchar(n)能存储几个汉字?varchar(n)表示n个字符,...
  • 一个字符占几个字节

    2020-12-10 00:56:32
     一个英文字母(不分大小写)个字节的空间,一个中文汉字个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。如一个ASCII码就是一...
  • 在mysql中,一个中文汉字所的字节数...1. 一个中文汉字多少字节与编码有关:UTF8:一个中文汉字=3个字节GBK:一个中文汉字=2个字节utf-8, 英文字母1字节2.varchar(n)能存储几个汉字?varchar(n)表示n个字符,...
  • utf-8的中文,一个字符占几个字节 https://blog.csdn.net/kindsuper_liu/article/details/80202150 英文字母和中文汉字在不同字符集编码下的字节数 英文字母: ·字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK...
  • 在mysql中,如果是latin1字符集下,一个中文汉字2个字节数;如果是utf8字符集下,一个中文汉字3个字节数;如果是gbk字符集下,一个中文汉字2个字节数。mysql各字符集下汉字和字母字节数varchar(N), 这里的N...
  • 在mysql中,一个中文汉字所的字节数...1. 一个中文汉字多少字节与编码有关:UTF8:一个中文汉字=3个字节GBK:一个中文汉字=2个字节utf-8, 英文字母1字节2.varchar(n)能存储几个汉字?varchar(n)表示n个字符,...
  • 中文标点3个字节,英32313133353236313431303231363533e59b9ee7ad9431333431376566文标点1个字节。在多数的计算机系统中,一个字节是一个8位长的数据单位,大多数的计算机用一个字节表示一个字符、数字或其他...
  • UTF-8中文一个汉字占几个字节

    千次阅读 2019-10-12 11:28:05
    英文字母和中文汉字在不同字符集编码下的字节数 英文字母: 字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK 字节数 : 1;编码:GB18030 字节数 : 1;编码:ISO-8859-1 字节数 : 1;编码:UTF-8 字节数 : 4;编码...
  • https://blog.csdn.net/kindsuper_liu/article/details/80202150英文字母和中文汉字在不同字符集编码下的字节数英文字母:·字节数 : 1;编码:GB2312字节数 : 1;编码:GBK字节数 : 1;编码:GB18030字节数 : 1;编码:...
  • utf-8的中文是一个字符占几个字节

    万次阅读 多人点赞 2018-05-05 01:40:02
    英文字母和中文汉字在不同字符集编码下的字节数 英文字母: ·字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK 字节数 : 1;编码:GB18030 字节数 : 1;编码:ISO-8859-1 字节数 : 1;编码:UTF-8 字节数 : 4;...
  • 今天在做回顾的时候看到的问题: 为什么两个运行的结果不一样呢? 1、弄清java中的字节与...Java采用unicode来表示字符,java中的一个char是2个字节,一个中文或英文字符的unicode编码都2个字节,但如果采...
  • javaInt占几个字节

    千次阅读 2019-11-27 08:56:06
    javaInt占几个字节 一个字节等于8位;1 byte = 8 bit。 在java中的中文和英文字母都是采用Unicode编码来表示的,一个Unicode编码为16位,1个字节是8位,所以1个Unicode码占2个字节。 不过英文字母比较特殊,它...
  • 中国比较复杂,1字节=8位,8位从0000 0000到1111 1111只能表示256个字符,2个字节是2*8=16位,从0000 0000 0000 0000到1111 1111 1111 1111可以表示65535个字符。 6万多个足以表示我们经常用的那些了。所以我们...
  • 1、美国人首先对其英文字符进行了编码,也就是最早的ascii码,用一个字节的低7位来表示英文的128个字符,高1位统一为0; 2、后来欧洲人发现尼玛你这128位哪够用,比如我高贵的法国人字母上面的还有注音符,这个怎么...

空空如也

空空如也

1 2 3 4 5
收藏数 99
精华内容 39
关键字:

中文字占几个字节