-
2019-02-18 20:10:38
- UTF-8编码下一个汉字(包括中文形式下的符号)一般是3个字节,一个英文(包括英文下的符号)1个字节,一个数字1个字节;
- 在GBK和GB2312编码下一个汉字(包括中文形式下的符号)是2个字节,一个英文(包括英文下的符号)1个字节,一个数字1个字节;
- Unicode编码一个汉字(包括中文形式下的符号)和一个英文(包括英文下的符号)一个数字都是4个字节;
- ASCII编码一个英文(包括英文下的符号)1个字节(不支持中文汉字),一个数字1个字节;
- ISO 8859-1编码一个英文(包括英文下的符号)1个字节(不支持中文汉字),一个数字1个字节
在Java中可以用以下代码测试字符所占的字节数
//在getBytes(String s)的参数s中输入编码方式,如:getBytes("utf-8"). //ISO 8859-1编码方式则是getBytes("ISO-8859-1") try { System.out.println("a".getBytes("GB2312").length); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); }
更多相关内容 -
Java中文字符所占的字节数
2020-12-22 23:23:14Java语言中,中文字符所占的字节数取决于字符的编码方式,一般情况下,采用ISO8859-1编码方式时,一个中文字符与一个英文字符一样只占1个字节;采用GB2312或GBK编码方式时,一个中文字符占2个字节;而采用UTF-8编码... -
英文字母和中文汉字所占字节数
2019-08-24 21:12:40 -
js获取字符串字节数方法小结
2020-12-10 11:16:37英文字母肯定lenght和字节数都一样:都是1 而中文lenght=1,字节数=2 因此,需要作的就是把中文字符的字节数计算出来。 方法一: alert('a'.replace(/[^\u0000-\u00ff]/g,"aaa").length); //原理:把中文... -
中文字符的字节数
2021-01-05 13:59:36Java语言中,中文字符所占的字节数取决于字符的编码方式,一般情况下,采用ISO8859-1编码方式时,一个中文字符与一个英文字符一样只占1个字节;采用GB2312或GBK编码方式时,一个中文字符占2个字节;而采用UTF-8编码...中文字符的字节数
Java语言中,中文字符所占的字节数取决于字符的编码方式,一般情况下,采用
ISO8859-1
编码方式时,一个中文字符与一个英文字符一样只占1个字节;采用GB2312
或GBK
编码方式时,一个中文字符占2个字节
;而采用UTF-8
编码方式时,一个中文字符会占3个字节
。我们可以通过String类的getBytes(String charsetName)方法来获取到字符串以指定编码方式编码后所得到的字节数组,然后字节数组的长度就是该字符串在指定编码方式下所占的字节数。
下面为一个测试示例:public static void main(String []args) throws UnsupportedEncodingException { // 运行结果:2 System.out.println("测试".getBytes("ISO8859-1").length); // 运行结果:4 System.out.println("测试".getBytes("GB2312").length); // 运行结果:4 System.out.println("测试".getBytes("GBK").length); // 运行结果:6 System.out.println("测试".getBytes("UTF-8").length); }
注意:
String类
的不带参数的getBytes()
方法会以程序所运行平台的默认编码方式为准来进行转换,在不同平台下就会有不同的结果,因此建议使用指定编码方式的getBytes(String charsetName)
方法。getBytes方法
getBytes
用于获取任意内容的字节数组
,比如如下获取中文字符的字节数组//Encodes this String into a sequence of bytes using the platform's default charset, storing the result into a new byte array. byte[] bytes = "测试".getBytes(); System.out.println(Arrays.toString(bytes)); System.out.println(bytes.length);//6
可以传入一个参数,
字符集编码
,不传就是系统默认的byte[] bytes = "测试".getBytes("GBK"); System.out.println(Arrays.toString(bytes));//[-78, -30, -54, -44] System.out.println(bytes.length);//4
再比如
byte[] bytes = "测试".getBytes("UTF-8"); System.out.println(Arrays.toString(bytes));[-26, -75, -117, -24, -81, -107] System.out.println(bytes.length);//6
源码
public byte[] getBytes() { return StringCoding.encode(value, 0, value.length); }
总结
getBytes
方法用于返回字符串的字节数组
- 中文字符
GBK
编码时,一个字符2个
字节,UTF-8
编码时,一个字符3个字节
-
字符型变量占用字节数 c语言里字符型数据占多少字节
2021-05-18 13:23:11一个字符型变量所占内存的字节数是一个字符型变量所占内存的字节数是 1个字节。字符与字符型变量有什么区别,都占几个字节(一)“字节”的定义 字节(Byte)是一种计量单位,表示数据量多少,它是计算机信息技术用于...一个字符型变量所占内存的字节数是一个字符型变量所占内存的字节数是 1个字节。
字符与字符型变量有什么区别,都占几个字节
(一)“字节”的定义 字节(Byte)是一种计量单位,表示数据量多少,它是计算机信息技术用于计量存储容量的一种计量单位。 (二)“字符”的定义 字符是指计算机中使用的文字和符号,比如
A、B、C、~¥#¥%……—*()——+、等等。
C语言字符数占几个字节,又是多少位。
英文字母:如果是char 型,那么是占用1个字节,8位。如果是string型,应该是两个字节,16位,因为末尾还有个\0字符。 比如: char c = 'a';//它占用一个字符 char c[]
c语言里字符型数据占多少字节
为什么在C语言中字符常量占四个字节而字符变量却只C语言中,字符型 char 变量对应于 ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)。ASCII 码的范围是 0 - 126 (十进制)。 用一个字节表示。所以,字符型 char 变量,占一个字节。
字符型数据在内存中占的字节数是_____?正常是一个char占1个字节(8个bit),如果是wchar则是2个字节(16bit)。
字节数,字符串长度,字符个数的区别?
在纯ASCII码下,字节数=字符串长度=字符个数,一个英文字母占一个字节的空间,一个中文汉 字占两个字节的空间,一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数, 换算为十进制,最小值0,最大值255。
-
Python len()函数详解:获取字符串长度或字节数
2020-12-09 23:49:13例如,定义一个字符串,内容为“http://c.biancheng.net”,然后用 len() 函数计算该字符串的长度,执行代码如下:>>...在 Python 中,不同的字符所占的字节数不同,数字、英文字母、小数点... -
不同字符集编码下:英文和中文所占的字节数,及ASCII码表
2020-11-28 17:29:53不同字符集编码下:英文和中文所占的字节数 一.UTF-8编码: 英文占用字节数:1个字节; 中文占用字节数:3个字节; 二.GBK编码,GB2312编码: 英文占用字节数:1个字节; 中文占用字节数:2个字节; 附:GBK是在国家标准GB2312... -
Java中字符编码和字符串所占字节数 .
2021-05-20 19:15:38首 先,java中的一个char是2个字节。java采用unicode,2个字节来表示一个字符...而Java采用unicode来表示字符,一个中文或英文字符的unicode编码都占2个字节,但如果采用其他编码方式,一个字符占用的字节数则各不相... -
js验证输入框可输入的字节数(完美判断中英文)
2019-10-30 10:33:11PS:英文占1个字节,中文占2个字节,所以限制输入50个汉字时,中文字符最多只能输入50个,而英文字符则最多可以输入100(50*2)个。 示例代码(看不懂的朋友可以结合注解一起看): <!DOCTYPE html> &l... -
不同编码各语言所占字节数及符号所占字节数
2020-03-29 19:56:32ASCII码: 一个英文字母(不分大小写)占一个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。换算为十进制,最小值-128,最大值127。如一个ASCII码就是一个字节。 UTF-8编码: 一... -
python关于文件操作中的字符个数和字节数
2020-12-04 05:45:52最后知道了就是字节数的原因。我们先来看个例子。新建个文件存为utf-8命名为0117utf-8.txt记得去掉BOM头。我们用r+模式尝试去修改>>> fp=open("d:\\pydelete\\0117utf-8.txt","r+")>>> fp.write(... -
英文字母和中文汉字在不同编码下的字节数对比
2018-06-14 16:30:30英文字母和中文汉字在不同字符集编码下的字节数对比英文字母:中文汉字:(括号内为中文汉字所占字节数)字节数 : 1(2);编码:GB2312字节数 : 1(2);编码:GBK字节数 : 1(2);编码:GB18030字节数 : 1(1);编码... -
汉字、英文在不同编码方式下占用字节数
2018-10-24 09:18:15英文字母和中文汉字在不同字符集编码下的字节数 英文字母: 字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK 字节数 : 1;编码:GB18030 字节数 : 1;编码:ISO-8859-1 字节数 : 1;编码:UTF-8 字节数 : 4;编码... -
IOS textField限制字节长度
2021-01-05 03:14:21有时又有需求,需要限定字节数目,而不是内容个数,就需要通过一些方法获取到字符串的字节数。比如,限定10个字节,则最多可以输入10个英文字母,或者5个汉字。 监听textField的长度变化,就需要设置textField的代理... -
Java基本数据类型占用字节数
2020-12-30 06:26:09在Java中有八大基本数据类型(1)整型int :整数类型short :短整型long :长整型byte :字节类型(2)浮点型float :浮点类型(单精度)double :浮点类型(双精度)(3)逻辑型boolean :布尔型(4)字符型char :字符型基本... -
JS计算字符串的字节数(十五)
2019-05-21 19:26:15字符串中的字节数,单个的字符,包括英文字符,数字,特殊字符等是一个字节,中文的汉字是两个字节。 求一个字符串的字节数,可以简化成判断某个字符是单个的字符,还是中文的字符。 但是,却... -
常用编码GBK,Unicode,UTF-8,单个中英文字符占用的字节数
2019-03-20 14:34:17GBK是在ANSI的基础上对中文(含繁体)的扩展,简体中文的windows环境中,VS默认GB2312编码. ...单个英文(含标点符号)占用 字节数 单个中文(含标点符号)占用字节数 GBK 1 2 UNICODE 2 2 UTF-8 1 3 ... -
c语言中“\x5d”在内存中占用多少字节数
2021-05-18 13:21:48所有的指针都是4个字节。#include #include int main(){char a[] = "\\xfds";printf("%d, %d", sizeof(a), strlen(a));}扩展资料:字节是二进制数据的单位。一个字节通常8位长。但是,一些老型号计算机结构使用不同... -
JavaScript|计算字符串的字节数
2020-07-25 00:00:00正则表达式法 由于中英文字符所占字节数不一样,但英文字符字节数和字符长度一致,因此,可以将一个中文字符替换为两个任意英文字符,便能直接用length计数。 因为JS使用Unicode编码,因此,这里用[^\x0000-\x00ff]... -
C语言字节大小day5
2021-05-19 08:00:54一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。如一个ASCI... -
gbk英文字符占几个字节?
2019-06-13 10:02:59➜ ~ python3 >>> bytes("你", "gbk") b'\xc4\xe3' >>> bytes("a", "gbk") b'a' >>> bytes("你", "utf-8") b'\xe4\xbd\xa0' >...gbk中文2个字节,英文1个字节;utf... -
Linux命令-统计文件中的字节数、字数、行数:wc
2021-05-14 15:05:48Linux系统中的wc(Word Count)命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显示输出。1.命令格式:wc [选项]文件...2.命令功能:统计指定文件中的字节数、字数、行数,并将统计结果显示输出。该... -
mysql数据类型及占用字节数
2021-03-01 15:49:471,int 类型 4字节 。备注:一个字节8位,即有32位,存在一个符号位。所以能存的数值大小为-2的31次方到2的31次方; 2,tinyint 类型 1字节。 3,smallint 类型 2字节 4,mediumint 类型 3字节 5,bigint 类型 8字节... -
Java字符串所占字节数的小总结
2019-02-02 15:17:38首先,char为Java的基本类型,基本类型所占的字节数是固定的,如int占4字节,double占8字节,这可以使得Java在不同的平台上所占类型...在String中,一个英文字符占1个字节,而中文字符根据编码的不同所占字节数也不... -
input输入框限制输入字节数
2016-11-03 14:44:44inut 输入框限制字节数 -
Java字符串中常用字符占用字节数
2021-08-27 15:54:05java中一个char型的数据(也就是一个字符)占两个字节。而Java中常用的字符包括数字、英文字母、英文符号、中文汉字、中文符号等,若在字符串中包含里面的多种字符,它们是否都占两个字符呢?答案是否定的。 public ... -
utf8mb4中文、英文、emoji占用字节、字符个数
2020-12-21 11:29:45中文(包括中文字符)占用3个 英文(包括英文字符)占用1个 emoji占用4个 使用 select 字段,length(字段),char_length(字段) from 表可以测试 其中length(字段)表示占用字节数,char_length表示有几个字符 -
js 限制输入框的字节数,中文两个字节,英文字母一个字节
2016-03-14 17:03:27也许在网上有很多类似的文章,但是这里大家应该知道,js里面,中文和字母的长度都是1,但是数据库不知道呀,数据库很多都是按照字节来的,所以,控制输入框的字节数看来比长度限制更为重要。 提出问题: 1、限制...