欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

[六]基础数据类型之浮点数简介

程序员文章站 2022-05-25 14:37:26
IEEE754标准,浮点数在计算机中的表示形式 浮点数的标准化形式 非标准化形式 最大值 最小值 取值范围 ......

java中,基本数据float 和double的包装类float和double都是浮点类型

所以对于浮点数在计算机中的表示方法需要有一个基本了解,否则很难了解清楚float和double的实现原理

本文对计算机中的浮点数表示ieee754标准,进行了简单介绍

浮点数的表示

ieee754 标准
  
 
 
因为指数有正有负,指数位中我们就要拿出第一位来指示符号,但是处理起来会不方便
所以给指数的真值 加上 指数偏移值 ,就能保证结果总是一个非负数  
标准规定
指数偏移值为  2(e−1) -1  e为指数的位数
单精度  指数偏移值为127     对于双精度  指数偏移值为1023  
指数无符号数表示的范围
单精度8位   0~255
双精度11位 0~2047
指数真值也就是实际的值
单精度 -127 ~ 128
双精度 -1022 ~ 1023
不过头尾 被保留, 会另做他用 ,下面会继续说明
所以实际的值要去掉头尾,也就是
单精度 -126 ~ 127
双精度 -1022 ~ 1023

规范化形式

综上,一个实数在计算机中表示形式为:

sign  s          符号位
exponent     指数部分
fraction        尾数部分
按照我们上面讲的,指数真值也就是实际的值
单精度 -127 ~ 128
双精度 -1022 ~ 1023
也就是不包括头尾, 也就是指数部分不包括 指数全是0 (0) 或者全是1(255)的情况 
这就是规范化形式,对于规范化形式,表示的数值如下
 
s = 符号位
m=1.f
e=指数值-指数偏移值
表示的数值为:
这是浮点数的规范化表示形式
s表示符号位
尾数部分前隐含一个小数点,小数点前隐含一个1
指数的真值e 也就是 指数部分表示的无符号数减掉指数偏移值

取值范围

单精度

单精度指数的范围(指数 - 指数偏移值之后的值 )  为:
-126 ~ 127
正数最大值
指数为正数的最大值 127
尾数 也为最大值 全部都是1  也就是23个1
(-1)0  × 1.11111...(23个1)  × 2127
 
也就是
(2−2−23)×2127
 
1.11111...(23个1)  = 20 +2-1 +2-2 + ....2-23
 
 
公比 q= 1/2    a1 = 20
代入公式 
正数最小值
指数为负数的最小值 -126
尾数 也为最小值, 全部都是0  也就是23个0
1.0  ×  2-126

 

双精度

双精度指数的范围(指数 - 指数偏移值之后的值 )  为:
-1022 ~ 1023
正数最大值
指数为正数的最大值 1023
尾数 也为最大值 全部都是1  也就是52个1
(-1)0  * 1.11111...(52个1)  * 21023 
也就是
(2−2−52)×21023   (还是等比数列求和)
正数最小值
指数为负数的最小值 -1022
尾数 也为最小值, 全部都是0  也就是52个0
1.0 × 2-1022  

非标准化形式

试想,对于单精度 1.001×2−125  和1.01×2−125, 它们的差值是0.001×2−125=1.0×2−128
两个数值之间的差小于能够表示的最小值
也就意味着两个不相等的数进行减法运算,将会瞬间下溢, 得到的结果将会是0
其实这就是精度不够的问题
所以又规定了非标准化形式
那么怎么区分什么时候是标准什么时候是非标准呢? 就是使用保留的指数的取值范围 
对于指数部分,如果所有的比特位全都是0 ,那么这就是一个非标准化形式
在非标准化情况下,尾数部分之前有隐含的小数点, 但是小数点之前,隐含的不在是1 而是0 
对于指数的真值,不再是指数部分表示的无符号数减掉指数偏移量
一旦指数部分为0  (也就是所有的比特位都是0),这就是一个标记符号了,不再有指数大小的含义
这种情况下 
指数的真值为  1 - 指数偏移量
单精度为 1-127= -126
双精度为 1-1023 = -1022
单精度  (−1)s ×  (0.f)  ×  2-126  
双精度  (−1)s ×  (0.f)  ×  2-1022

 

取值范围

很显然,对于非标准化形式来说,指数的真值变成了固定值
想要获得正数的最小值,只需要最后一位为1 其他所有的尾数部分全都是0即可
单精度 0.0000...1(23位,最后一位为1)  ×  2-126   =  2-23 ×  2-126  2-149 
双精度 0.0000...1(52位,最后一位为1)  ×  2-1022 = 2-52 ×   2-1022 = 2-1074 

 

特殊值

指数部分表示的无符号数,头尾被保留,用于表示一些特别的含义
对于标准化形式,指数部分 既不是全0  也不是全1
非标准化情况下,指数部分为全0

当指数部分中所有bit的值全是1,f中所有bit的值全是0,表示无穷大
根据符号位来区分正无穷和负无穷
当指数部分中所有bit的值全是1,f中所有bit的值不全是0  表示nan(not a number)
如果 指数 是0 并且 小数部分 是0, 这个数是0 根据符号位区分+0  和  -0