精华内容
下载资源
问答
  • gbk英文字符占几个字节?

    千次阅读 2019-06-13 10:02:59
    ➜ ~ python3 >>> bytes("你", "gbk") b'\xc4\xe3' >>> bytes("a", "gbk") b'a' >>> bytes("你", "utf-8") b'\xe4\xbd\xa0' >...gbk中文2个字节英文1个字节;utf...

    ➜ ~ python3

    >>> bytes("你", "gbk")
    b'\xc4\xe3'
    >>> bytes("a", "gbk")
    b'a'
    >>> bytes("你", "utf-8")
    b'\xe4\xbd\xa0'
    >>> bytes("a", "utf-8")
    b'a'
    

    gbk中文2个字节,英文1个字节;utf-8中文3个字节,英文1个字节
    字符占几个字节

    英文字母:
    字节数 : 1;编码:GB2312
    字节数 : 1;编码:GBK
    字节数 : 1;编码:GB18030
    字节数 : 1;编码:ISO-8859-1(latin-1)
    字节数 : 1;编码:UTF-8
    字节数 : 4;编码:UTF-16
    字节数 : 2;编码:UTF-16BE
    字节数 : 2;编码:UTF-16LE
    
    中文汉字:
    字节数 : 2;编码:GB2312
    字节数 : 2;编码:GBK
    字节数 : 2;编码:GB18030
    字节数 : 1;编码:ISO-8859-1(latin-1)
    字节数 : 3;编码:UTF-8
    字节数 : 4;编码:UTF-16
    字节数 : 2;编码:UTF-16BE
    字节数 : 2;编码:UTF-16LE
    
    展开全文
  • gbk英文占几个字节

    千次阅读 2018-05-14 12:21:18
    gbk英文字符占几个字节? ➜ ~ python3 >>> bytes("你", "gbk") b'\xc4\xe3' >>> bytes("a", "gbk") b'a' >>&...
    • gbk英文字符占几个字节?
    ➜  ~ python3
    >>> bytes("你", "gbk")
    b'\xc4\xe3'
    >>> bytes("a", "gbk")
    b'a'
    >>> bytes("你", "utf-8")
    b'\xe4\xbd\xa0'
    >>> bytes("a", "utf-8")
    b'a'

    gbk中文2个字节,英文1个字节;utf-8中文3个字节,英文1个字节

    • 字符占几个字节
    英文字母:
    字节数 : 1;编码:GB2312
    字节数 : 1;编码:GBK
    字节数 : 1;编码:GB18030
    字节数 : 1;编码:ISO-8859-1(latin-1)
    字节数 : 1;编码:UTF-8
    字节数 : 4;编码:UTF-16
    字节数 : 2;编码:UTF-16BE
    字节数 : 2;编码:UTF-16LE
    
    
    中文汉字:
    字节数 : 2;编码:GB2312
    字节数 : 2;编码:GBK
    字节数 : 2;编码:GB18030
    字节数 : 1;编码:ISO-8859-1(latin-1)
    字节数 : 3;编码:UTF-8
    字节数 : 4;编码:UTF-16
    字节数 : 2;编码:UTF-16BE
    字节数 : 2;编码:UTF-16LE

    印光大师十念法(胡小林主讲第1集)
    http://v.youku.com/v_show/id_XMzUwMzc4NzY4NA
    此生必看的科学实验-水知道答案
    http://v.youku.com/v_show/id_XMjgzMzcwNDk4OA

    展开全文
  • GBK(国标码)英文几个字节? 很确定的说GBK不管中英文都是2字节,但是为什么我们试验的情况下为1字节?因为我们使用的是半角,当使用半角时候使用的使用的是ASCII 码,所以为一字节。 1个字符多少字节? GBK: ...

    GBK(国标码)英文是几个字节?
    很确定的说GBK不管中英文都是2字节,但是为什么我们试验的情况下为1字节?因为我们使用的是半角,当使用半角时候使用的使用的是ASCII 码,所以为一字节。

    1个字符占多少字节?
    GBK: 中英2Byte
    UTF-8: 英1Byte 中3Byte
    UTF-16 : 无论中英 2个或者4个Byte

    展开全文
  • GBK编码中字符个字节 截图源于百度百科 UTF-8编码常用中文字符3字节、不常用中文字符4个字节 截图源于百度百科 Unicode、ISO 10646、UTF-8、GB-2312、GBK的起源 一开始我对Unicode、ISO 10646、UTF-8、GB-...

    为了防止大家在搜索时只想要结果,这里先说明结果

    GBK编码中字符占两个字节

    截图源于百度百科
    在这里插入图片描述

    UTF-8编码常用中文字符占3字节、不常用中文字符占4个字节

    截图源于百度百科
    在这里插入图片描述

    Unicode、ISO 10646、UTF-8、GB-2312、GBK的起源

    一开始我对Unicode、ISO 10646、UTF-8、GB-2312、GBK这几个常见的编码编码表的区别并不清晰,所以先进行整理这些编码的区别

    首先计算机只能认识二进制,那么在我们的字符存入计算机硬盘当中必然存在一个中间的翻译过程
    在这里插入图片描述
    这种翻译的过程就是编码和解码的过程:比如我们想将数据存入计算机,那么我们需要将我们的字符翻译为计算机看得懂的二进制形式,那这中间一定存在一些对照关系,比如a对应的十进制的编码就是97,然后将十进制的编码转换为二进制的编码就是计算机认识的形式了

    ASCII编码

    但是这也出现了一个问题,就是这种字符对应编码的关系,如果我说他是97,而别人说它是10,那我这里存入到计算机硬盘中的文件从它那里打开就会乱码,这时候就需要一些规范了,最早的规范是ASCII编码表

    截图来源于百度百科
    在这里插入图片描述

    在这里插入图片描述

    基础ASCII码使用了7位二进制数(剩下的一位二进制数为0)所以基数ASCII标识的字符占用一个字节,最多对应128个字符,简单解释为什么:一字节=8位,七位的个数位27=128,所以最多对应128个字符

    这时候我们发现,这些字符只能够提供使用英语的国家使用,但是像我们的汉字如果使用ASCII编码表的话一定会乱码,因为ASCII编码中不存在汉字的对应编码

    GB2312-80编码、GBK 编码、GB18030编码

    我们的中文编码表都有:GB2312-80 标准、GBK 编码标准、GB18030编码标准
    GB2312-80 标准
    这里我们还需要解释GBK编码标准,GBK是遵循了ISO编码规范的(什么是ISO编码规范后面介绍),
    在这里插入图片描述
    并且现在进行编码简写的时候填写gb2312和gbk都是可以的
    在这里插入图片描述

    由于世界上的国家语言很多编码也很多,为了有个公共标准以便于相互之间的编码不产生乱码的情况,这时候就出现了Unicode(又称统一码、万国码、单一码),但是我们需要明确Unicode并不是编码表,而是一种规范,这种规范的好处就是满足该规范的编码可以相互转换,这样就做到了编码全球通用。

    同时还有一个标准做的也是同样的事情,那就是ISO/IEC 10646标准,该标准后来和Unicode标准达成统一共识,他们两种标准都相互兼容,都是用于规范全球的多种编码。
    截图来自百度百科
    在这里插入图片描述

    UTF-8编码

    然后我们再来解释utf-8编码,该编码就是遵循unicode规范的编码,并且兼容ASCII编码
    在这里插入图片描述
    utf-8使用的是可变长字节编码,他能过实现多种字符的编码
    在这里插入图片描述

    总结:Unicode、ISO 10646、UTF-8、GB-2312、GBK的区别

    首先unicode是一个规范,用于全球统一编码,就是防止出现不同国家使用不同的编码表而出现的乱码情况

    其次IOS和unicode做的是同样的事情,并且unicode和IOS都相互兼容

    UTF-8就是一个遵循了Unicode规范的编码,它能够包含中文等多种字符的编码

    GBK时一个遵循了ISO规范的编码,向下兼容GB2312编码

    展开全文
  • GBK与UTF-8的中文是一个字符占几个字节 编码GBK 字节数:2 编码:UTF-8 字节数:3 欢迎使用Markdown编辑器 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, ...
  • GBK是在ANSI的基础上对中文(含繁体)的扩展,简体中文的windows环境中,VS默认GB2312编码. ...单个英文(含标点符号)占用 字节数 单个中文(含标点符号)占用字节GBK 1 2 UNICODE 2 2 UTF-8 1 3 ...
  • UTF-8编码占几个字节?

    万次阅读 2019-01-29 16:18:00
    2个字节的:带有附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母则需要二个字节编码 3个字节的:基本等同于GBK,含21000多个汉字 4个字节的:中日韩超大字符集...
  • 一个汉字到底占几个字节

    千次阅读 2020-08-12 16:31:47
    总结:这和编码有关,UTF8一个汉字3个字节GBK一个汉字2个字节。 当我上第一节计算机课的时候,我的电脑老师跟我说,一个英文字符是1个字节,一个中文是2个字节。这么多年来,我对此一直坚信不移,相信很多人也...
  • 可是我在windows下或linux下(确认是gbk编码)测试中发现英文字母占用个字节,这是怎么回事? 例:a你b好,编码是:61 C4 E3 62 BA C3 英文字母是1byte. lz 如果想感受2byte的字符,可以用全角试一下
  • Oracle 一个中文汉字 占用几个字节,要根据Oracle中字符集编码决定 查看oracle server端字符集 select userenv('language') from dual; 如果显示如下,一个汉字占用两个字节 SIMPLIFIED CHINESE_CHINA.ZHS16GBK 如果...
  • gbk,utf-8占用字节

    千次阅读 2020-04-28 14:48:45
     汉字3个字节、数字1个字节英文字母1个字节 例: <?php //测试时文件的编码方式要是UTF8 $str='中文a字1符'; echo strlen($str).'<br>';//14 echo mb_strlen($str...
  • 2个字节的:带有附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母则需要二个字节编码 3个字节的:基本等同于GBK,含21000多个汉字 4个字节的:中日韩超大字符集...
  • gbk:一个汉字,2个字节 utf-8:一个汉字,3个字节 public static void main(String[] args) { try { String str="我交电话费看到接口过节费苦尽甘来开发接口了感觉风口浪尖赶快来将佳都科技疯狂夺金看...
  • GB18030向下兼容GBK和GB2312编码,每个英文占1个字节(正数),每个中文2个字节(第一个负数、第二个可正可负) GBK 兼容GB2312,每个中文2个字节,每个英文占1个字节 Unicode 国际码表,每个字符2...
  • 字符集常用字符集分类ASCII及其扩展字符集作用:表语英语及西欧语言。位数:ASCII是用7位表示的,能表示128字符;其扩展使用8位表示,表示256字符。范围:ASCII从00到7F,扩展从00到FF。ISO-8859-1字符集作用:...
  • Java中Char占用几个字节???

    千次阅读 2019-09-16 10:51:46
    也许你看到的一些书上说Char占用2...GBK编码2个字节; 但是如果 char表示英文字母: 在uft8编码下个字节;在GBK编码下还是2个字节;所以GBK编码下:char类型的值不管是英文还是中文都是统一2个字节! ...
  • Java一个汉字占几个字节(详解与原理)(转载)

    万次阅读 多人点赞 2019-05-29 23:33:35
    今天学习Netty做定长消息发送时,发现到UTF-8编码下的中文并非两个字节,是三个字节,omg~,遂翻了篇博客后才发现原来java中文对应的字节长度还有这么多说道,涨姿势了,咳咳~ 原文如下: 忒长了,原文作者大大辛苦...
  • ASCII码在计算机内部,所有的信息最终都表示为一二进制的字符串。每一二进制位(bit)有0和1两种状态,因此八二进制位就...上世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规
  • 一个汉字在数据库中占几个字节

    千次阅读 2020-04-18 10:19:58
    UTF-8字符集,一个汉字个字节gbk字符集,一个汉字个字节,比如varchar(10)类型的字段,UTF-8的汉字,只能存3个,gbk字符集的汉字却能存5个。所以在程序中根据表字段varchar的大小,保存或更新时...
  • 【汉字编码几个字节

    千次阅读 2019-07-01 13:23:28
    关于汉字的编码问题 ...然而在《python从入门到精通》书中看到,GBK与GB2312汉字2个字节,而UTF-8中汉字3个字节,然而之前接触java,记得UTF-8编码下汉字是2、3、4个字节,是不确定,在这里有些迷惑; ...
  • Oracle 一个中文汉字 占用几个字节,要根据Oracle中字符集编码决定 查看oracle server端字符集 select userenv('language') from dual;如果显示如下,一个汉字占用两个字节SIMPLIFIED CHINESE_CHINA.ZHS16GBK ...
  • 英文在utf8和GBK中所占字节
  • byte[] bb="hello".getBytes("gb2312");System.out.println("bb.length:::"+bb.length);...运行代码得到如下结果:bb.length:::5hello我查了一些资料,都说gb2312中的所有字符都是用二个字节表示。如果是这样,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 35,795
精华内容 14,318
关键字:

gbk编码英文占几个字节