精华内容
下载资源
问答
  • java单精度和双精度的区别

    千次阅读 2021-03-17 12:15:53
    为什么会有精度问题?计算机处理数据都涉及到数据的转换各种复杂运算,比如,不同单位换算,不同进制(如二进制十进制)换算等,很多除法运算不能除尽,比如10÷3=3.3333.。。。。。。无穷无尽,而精度是有限的,3....

    为什么会有精度问题?

    计算机处理数据都涉及到数据的转换和各种复杂运算,比如,不同单位换算,不同进制(如二进制十进制)换算等,很多除法运算不能除尽,比如10÷3=3.3333.。。。。。。无穷无尽,而精度是有限的,3.3333333x3并不等于10,经过复杂的处理后得到的十进制数据并不精确,精度越高越精确。float有8位有效数字,double有16位有效数据,float和double都是到大到一定的值自动开始使用科学计数法,并保留相关精度的有效数字,所以结果是个近似数。如果更精确的运算小数(比如金融,数学),希望结果更符合预期值应该使用Bigcimal。计算器应该也会有精度问题,也会有二进制十进制转换。

    java的双精度和单精度的区别

    现实问题中不但有整型数值,还有小数。Java语言也提供了针对小数的存储类型,分别是float类型和double类型。

    Java语言的浮点类型有两种不同的表示形式:十进制数和科学计数法。十进制数形式,由数字和小数点组成,且必须有小数点,如0.123、12.85、26.98等;科学计数法形式,如:2.1E5、3.7e-2等。其中e或E之前必须有数字,且e或E后面的指数必须为整数。

    科学计数法

    一种简化计数的方法,对于位数较小的数值,科学计数法没有什么优势,但对于位数较多的数值其计数方法的优势就非常明显了。例如:光的速速是300,000,000米/秒,全世界人口数大约是6,100,000,000。类似光的速度和世界人口数这样大数值的数,读、写都很不方便,仔细观察上面的两个数值,光的速度可以写成3*108,全世界人口数可以写成6.1*109。这种计数方法就是科学计数法,用Java语言科学计数法表示光速是3E8,世界人口数大约是6.1E9。

    一个较大的数值(》0)可以用下面的方式来表示:

    a * 10n (1《=a《10,n为整数)

    其中,a是该数值的有效位数,有效位数从左边第一个不是0的数起,到末尾数字为止,所有的数字(包括0,科学计数法不计10的n次方),称为有效数字。例如:光速是3E8,其有效数字是1位,值是3;世界人口数大约是6.1E9,其有效数字是2位,值是6.1。

    n是该数值的整数部分减1的正整数。

    一个较小的数值(《0)可以用下面的方式来表示:

    a * 10-n (1《=a《10,n为整数)

    a的取值同上面相同,n的取值为原数中左边第一个不为0的数字前面所有的0的个数(包括小数点前面的0)。

    在Java语言中,浮点类型有float和double两种,分别代表单精度和双精度的数值。精度是指描述一个数值的准确程度,在数学运算中,经常会用到近似数,近似数与原数值非常相近,但又不完全符合原数值,只能说在某种程度上近似。精度与近似数相似,也是用一个与原数值非常相近的数代替原来的数值。

    前面说过存储一个数值所用的字节越多,其精度越高,数值范围也越大。由此看来,精度与存储字节数密切相关,float类型的存储空间是4个字节,其表示的值范围约为10-38到1038,double类型的存储空间是8个字节,其表示的值范围约为10-308到10308,float存储数值的精度和范围要小于double存储数值的精度和范围。因此,float是单精度数值,double是双精度数值。

    ccd0f2fa3241652d2acd07571c11df29.png

    float变量可按如下方式声明:

    3e01cb36c2fe5b9cc4526c4dc9f1ccc9.png

    double变量可按如下方式声明:

    d99bbf6edaa68d6c6cae1ea02c75c68c.png

    数值赋值给float变量时,数值尾部要加上小写“f”或大写“F”声明为float数值,不然编译器会给出“可能损失精度的错误”如下图所示。因为在Java语言中,带小数的数值默认为是double类型,double类型转换为float类型,自然要损失精度了。

    3080c95ddcee1699521fe6b0ecb6de6e.png

    在 Java 程序中使用浮点数和小数时,不能假定浮点计算一定产生整型或精确的结果,浮点数不是精确值,使用它们会导致舍入误差。

    展开全文
  • 单精度双精度

    2021-02-04 22:46:23
    含义:表明单精度和双精度精确的范围不一样,单精度,也即float,一般在计算机中存储占用4字节,也32位,有效位数为7位;双精度(double)在计算机中存储占用8字节,64位,有效位数为16位。原因:不管float还是double ...

    浮点数7位有效数字.

    双精度数16位有效数字.

    含义:表明单精度和双精度精确的范围不一样,单精度,也即float,一般在计算机中存储占用4字节,也32位,有效位数为7位;双精度(double)在计算机中存储占用8字节,64位,有效位数为16位。

    原因:不管float还是double 在计算机上的存储都遵循IEEE规范,使用二进制科学计数法,都包含三个部分:符号位,指数位和尾数部分。其中float的符号位,指数位,尾数部分分别为1, 8, 23. 双精度分别为1, 11, 52。

    精度主要取决于尾数部分的位数,float为23位,除去全部为0的情况以外,最小为2的-23次方,约等于1.19乘以10的-7次方,所以float小数部分只能精确到后面6位,加上小数点前的一位,即有效数字为7位。 类似,double 尾数部分52位,最小为2的-52次方,约为2.22乘以10的-16次方,所以精确到小数点后15位,有效位数为16位。

    6d0bf3b377f2d3addd23db65fcda1d19.png

    792c95e779d42e2291cad490d5c2c098.png

    有效数字:一般地,一个近似数,四舍五入到哪一位,就说这个数精确到哪一位,这时,从左边第一个不是0的数字起,到精确的数位止,所有的数字,都叫做这个数的有效数字.

    对没有小数位且以若干个零结尾的数值,从非零数字最左一位向右数得到的位数;对其他十进位的数,从非零数字最左一位向右数而得到的位数就是有效位数.

    例如:3.3 有二个有效数字

    3.33 有三个有效数字

    讨论:近似数0.038有几个有效数字,0.03080呢?

    分别有二和四位有效数字

    案例:2703.625(10进制)转换为IEEE 754的32位单精度浮点格式

    整数部分:

    采用除基取余法,基数为16,

    2703/16,商168,余15,即F

    168/16,商10,余8

    10/16,商0,余10,即A

    从上到下依次是个位、十位、百位,

    所以,最终结果为(A8F)16。

    (2703)10=(A8F)16=(1010 1000 1111)2

    小数部分

    0.625×2=1.25,取1

    0.25×2=0.5,取0

    0.5×2=1,取1

    (0.625)10=(0.101)2

    (2703.625)10

    =(2703)10+(0.625)10

    =(1010 1000 1111)2+(0.101)2

    =(1010 1000 1111.101)2

    单精度浮点数保存的字节格式如下:

    地址:+0 +1 +2 +3

    内容:SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM

    根据IEEE浮点数的定义,将上述二进制数规格化:

    (2703.625)10

    >(101010001111.101)2

    >+1.01010001111101 * (2^11)

    符号S为正,等于0 B;

    指数EEEEEEEE为11+127=138,等于10001010 B;

    尾数为01010001111101000000000 B;

    合成后为

    0 10001010 010 1000 1111 1010 0000 0000

    若将上述值表示为十六进制数,则为(45 28 FA 00)16。

    展开全文
  • 126) * 0.1 = 2**(-127) 0 00000000 00000000000000000000001 = +1 * 2**(-126) * 0.00000000000000000000001 = 2**(-149) (Smallest positive value) 双精度 IEEE双精度浮点标准表示需要64位字,其可以从左到右表示...

    注意:

    Nintendo 64有一个64位处理器,但是:

    Many games took advantage of the chip’s 32-bit processing mode as the greater data precision available with 64-bit data types is not typically required by 3D games, as well as the fact that processing 64-bit data uses twice as much RAM, cache, and bandwidth, thereby reducing the overall system performance.

    The term double precision is something of a misnomer because the precision is not really double.

    The word double derives from the fact that a double-precision number uses twice as many bits as a regular floating-point number.

    For example, if a single-precision number requires 32 bits, its double-precision counterpart will be 64 bits long.

    The extra bits increase not only the precision but also the range of magnitudes that can be represented.

    The exact amount by which the precision and range of magnitudes are increased depends on what format the program is using to represent floating-point values.

    Most computers use a standard format known as the IEEE floating-point format.

    单精度

    IEEE单精度浮点标准表示需要一个32位字,从左到右可以表示为从0到31编号。

    >第一位是符号位,S,

    >接下来的8位是指数位,’E’和

    >最后23位是分数’F’:

    S EEEEEEEE FFFFFFFFFFFFFFFFFFFFFFF

    0 1 8 9 31

    由字表示的值V可以如下确定:

    >如果E = 255且F为非零,则V = NaN(“不是数字”)

    >如果E = 255且F为零,S为1,则V = -Infinity

    >如果E = 255且F为零,S为0,则V =无穷大

    >如果0

    意在表示通过用F加前缀而创建的二进制数

    隐式前导1和二进制点。

    >如果E = 0且F为非零,则V =( – 1)** S * 2 **(-126)*(0.F)。这些

    是“非规范化”值。

    >如果E = 0且F为零,S为1,则V = -0

    >如果E = 0并且F为零并且S为0,则V = 0

    尤其是,

    0 00000000 00000000000000000000000 = 0

    1 00000000 00000000000000000000000 = -0

    0 11111111 00000000000000000000000 = Infinity

    1 11111111 00000000000000000000000 = -Infinity

    0 11111111 00000100000000000000000 = NaN

    1 11111111 00100010001001010101010 = NaN

    0 10000000 00000000000000000000000 = +1 * 2**(128-127) * 1.0 = 2

    0 10000001 10100000000000000000000 = +1 * 2**(129-127) * 1.101 = 6.5

    1 10000001 10100000000000000000000 = -1 * 2**(129-127) * 1.101 = -6.5

    0 00000001 00000000000000000000000 = +1 * 2**(1-127) * 1.0 = 2**(-126)

    0 00000000 10000000000000000000000 = +1 * 2**(-126) * 0.1 = 2**(-127)

    0 00000000 00000000000000000000001 = +1 * 2**(-126) *

    0.00000000000000000000001 =

    2**(-149) (Smallest positive value)

    双精度

    IEEE双精度浮点标准表示需要64位字,其可以从左到右表示为从0到63编号。

    >第一位是符号位,S,

    >接下来的11位是指数位,’E’和

    >最后52位是分数’F’:

    S EEEEEEEEEEE FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF

    0 1 11 12 63

    由字表示的值V可以如下确定:

    >如果E = 2047且F为非零,则V = NaN(“不是数字”)

    >如果E = 2047且F为零,S为1,则V = -Infinity

    >如果E = 2047,F为零,S为0,则V =无穷大

    >如果0

    意在表示通过用F加前缀而创建的二进制数

    隐式前导1和二进制点。

    >如果E = 0且F为非零,则V =( – 1)** S * 2 **(-1022)*(0.F)

    是“非规范化”值。

    >如果E = 0且F为零,S为1,则V = -0

    >如果E = 0并且F为零并且S为0,则V = 0

    参考:ANSI / IEEE标准754-1985,二进制浮点算术标准。

    展开全文
  • 计算机程序中的浮点数分为单精度浮点数和双精度浮点数。单精度和双精度精确的范围不一样。计算机里的最基本的存储单位用位(bit)来表示。bit只能用来存储0或1。稍大一点的单位是字节(Byte,简写为B)。再大一级的是千...

    上节课 简单介绍了浮点数。计算机程序中的浮点数分为单精度浮点数和双精度浮点数。

    单精度和双精度精确的范围不一样。

    计算机里的最基本的存储单位用位(bit)来表示。bit只能用来存储0或1。

    稍大一点的单位是字节(Byte,简写为B)。

    再大一级的是千字节(kilo Bytes),用k来表示。

    再大一级的单位是兆字节(Mega Bytes),用M来表示。一张照片的大小通常为1~3M。

    再大一级的单位为G。一部高清电影的大小通常为1~2G。

    再大一级的单位为T。

    换算关系为:

    1B = 8bit

    1k = 1024B = 2^10 B

    1M = 1024k = 2^20 B

    1G = 1024M = 2^30 B

    1T = 1024G = 2^40 B

    单精度(float)在计算机中存储占用4字节,32位,有效位数为7位(6位小数+小数点)。

    双精度(double)在计算机中存储占用8字节,64位,有效位数为16位(15位小数+小数点)。

    不管是float还是double,在计算机中的存储都遵循IEEE规范,使用二进制科学计数法,都包含三个部分:符号位、指数位和尾数部分。其中float的符号位、指数位(即整数部分)、尾数部分分别为1, 8, 23。双精度则分别为1, 11, 52。

    13999e901fe136bfe619bbf49e583aa8.png

    float

    9aeeae867ea6f309a012870580d2bccd.png

    double

    精度主要取决于尾数部分的位数,float为23位,最小为2的-23次方,约等于1.19乘以10的-7次方,所以float小数部分只能精确到后面6位,加上小数点算做一位,即有效数字为7位。

    类似,double 尾数部分52位,最小为2的-52次方,约为2.22乘以10的-16次方,所以精确到小数点后15位,有效位数为16位。

    程序验证:

    #include

    int main()

    {

    float a = 1.123456789;

    printf("a = %20.9f\n", a);

    double b = 2.123456789;

    printf("b = %20.9f\n", b);

    return 0;

    }

    注意:这里%20.9f表示浮点数总共有20位,其中小数占9位。不足20位的部分,左侧用空格来填充。

    运行结果:

    a = 1.123456836

    b = 2.123456789

    从运行结果可以看出,单精度浮点数小数部分只有前6位是准确的,后三位是不准确的。双精度小数部分9位都是准确的。

    展开全文
  • c语言单精度和双精度的区别.pdf

    千次阅读 2021-05-20 16:33:56
    c 语言单精度和双精度的区别c 语言单精度和双精度的区别单精度是这样的格式, 1 位符号, 8 位指数, 23位小数。双精度是 1 位符号, 11 位指数, 52 位小数。区别就是它所能存储的数值范围大小不同,双精度变量能...
  • 展开全部单精32313133353236313431303231363533e58685e5aeb931333365656466度与双精度的区别:1、单精度数是指计算机表达实数近似值的一种方式。单精度,也就是 float ,在 32 位机器上用 4 个字节来存储的;而...
  • 用"lf”输出不了双精度可能是用户定义时定义为单精度,那么可能不能用双精度输出。至于输出答案有时为正零有时为负零,那么可能是用户求出的答案超出精度范围了。扩展资料:1、printf()函数printf()函数是格...
  • 什么是单精度和双精度 单精度和双精度的字节数不同。前者占4个字节;后者占8个字节。 面试题目: 1.java中3*0.1==0.3将会返回什么?true还是false? fale,因为浮点数不能完全精确的表示出来,一般会损失精度。 2....
  • 在matlab中有这么两个函数hex2num(str),将16进制字符串str(默认双精度)转换成一个数(如果加一个类型转换可以转换为单精度hex2num(single(str))num2hex(num),将一个双精度的数num(默认)装换成16进制字符串(当然也...
  • 计算机中float, double类型数据分别占据4,8个字节,其中float类型double可以表示的小数位数不同,导致了精度不同。double的精度更高。 计算机中数据的表示由:符号位, 指数位,尾数位组成。比如一个float类型...
  • 本文就带各位温顾温顾java浮点型、单精度浮点数、双精度浮点数。浮点型首先明确java中浮点型数据类型主要有:单精度float、双精度double至于浮点型就是跟int ,string类型差不多。都是数据类型。浮点型浮点型别给我...
  • 单精度双精度理解

    2021-11-05 10:17:49
    单精度:float 双精度:double B/S:网页端 C/S:客户端
  • 分别进行100万次双精度单精度浮点数加运算,计算各消耗多少时间,打印输出累加结果。 测试代码 void fpSpeedTest(void) { int begin_tick, end_tick; double dp1 = 1.0; double dp2 = 1.0; double dp = 0.0; ...
  • Java语言也提供了针对小数的存储类型,分别是float类型double类型。Java语言的浮点类型有两种不同的表示形式:十进制数科学计数法。十进制数形式,由数字小数点组成,且必须有小数点,如0.123、12.85、26.98等;...
  • 计算机程序中的浮点数分为单精度浮点数和双精度浮点数。单精度和双精度精确的范围不一样。计算机里的最基本的存储单位用位(bit)来表示。bit只能用来存储0或1。稍大一点的单位是字节(Byte,简写为B)。再大一级的是千...
  • 题对于实现精确IEEE 754算术的C99编译器,f的值,float类型的除数是否存在,使得f / divisor!...上下文提供符合IEEE 754标准的浮点的C编译器只能通过单次精度乘以逆来用常量替换单精度除法,如果所述逆本身可以表...
  • 展开全部单精度数是62616964757a686964616fe59b9ee7ad9431333431353330指计算机表达实数近似值的一种方式。VB中Single(单精度浮点型)变量存储为 IEEE 32 位(4 个字节)浮点数值的形式,它的范围在负数的时候是从 -3....
  • 1.01 * 2^-3, 去除前导1指数得出尾数 = 01 双精度浮点数(Double) 双精度浮点数的计算类似于单精度浮点数,只不过存储大了一倍,它使用64位二进制数进行存储,与单精度浮点数相似,最高位63是符号位,用来表示正...
  • 展开全部一、字e68a843231313335323631343130323136353331333431353363节数不同1、float占4个字节,也就是32位。2、double占8个字节,也就是64位。二、指数域位数不同1、float的指数域是8位,可表达的范围为0~255。...
  • 3.14是单精度,3.14159是双精度。两者区别如下:一、指代不同1、单精度:是指计算机表达实数近似值的一种方式。2、双精度:此数据类型与单精度数据类型(float)相似,但精确度比float高。二、占用空间不同1、单精度:...
  • 矩阵乘法是通过sgemm(单精度dgemm(双精度)Intel的MKL库调用,通过纽比.dot功能。库函数的实际调用可以用例如oprof进行验证。在 这里使用2x18核的CPU E5-2699 v3,因此总共有36个物理内核。 KMP_AFFINITY=...
  • 科学计数法把数字表示为系数(coefficient)(也称为尾数(mantissa)),指数 (exponent)两部分。比如 3.684*10^2. 在十进制中,指数的基数为 10,并且表示小数点移动多少位以生成系数。每次小数点向前移动时,指数就...
  • 本文就带各位温顾温顾java浮点型、单精度浮点数、双精度浮点数。浮点型首先明确java中浮点型数据类型主要有:单精度float、双精度double至于浮点型就是跟int ,string类型差不多。都是数据类型。浮点型浮点型别给我...
  • 科学计数法把数字表示为系数(coefficient)(也称为尾数(mantissa)),指数 (exponent)两部分。比如 3.684*10^2. 在十进制中,指数的基数为 10,并且表示小数点移动多少位以生成系数。每次小数点向前移动时,指数就...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 143,233
精华内容 57,293
关键字:

双精度和单精度之差