Java里float在乘以5之后会出现很多小数的原因:在Java中,当我们对一个float类型的数字乘以5时,由于5不是2的幂,因此无法准确地表示为浮点数,所以在计算时会出现舍入误差。这种舍入误差可能会导致精度丢失,从而出现很多小数。
一、Java里float在乘以5之后会出现很多小数的原因
在Java中,float类型是单精度浮点数,它用32个二进制位来表示一个浮点数。由于使用了有限的位数来表示浮点数,所以在进行一些复杂的计算时,可能会出现精度丢失的问题。当我们对一个float类型的数字乘以5时,由于5不是2的幂,因此无法准确地表示为浮点数,所以在计算时会出现舍入误差。这种舍入误差可能会导致精度丢失,从而出现很多小数。
例如,将0.1f乘以5,在Java中实际上是对0.10000000149011612f进行乘法运算,得到0.5000000596046448f。这个结果与0.5不完全相等,因为它带有一定的误差。
二、浮点数简介
1、基本数据类型
关于数值,时刻牢记三点:
- 每个基本类型的数值都是有范围限制的,不是无限大的。
- 无论是boolean,int,float,string,struct,object,最终都对应计算机的一个byte或者多个byte。
- 非必需,不要使用浮点数。
在工作中会经常遇到的几个问题:
- 计算机中32位的有符号整型int,其最大值就是2147483647,这个数大约是21亿多。如果放普通计算应该都不成问题。但是,如果你数据库表的主键是int类型,那你就要小心了,好多大厂都在这个数据类型上面栽过跟头。因为现在中国网民基数太大,一张表很容易上亿,一旦超过21亿多,你的系统可能会因为db主键溢出导致故障。
- 在金融行业应该注意数值溢出的问题。两个integer相加或者相乘,其结果值很有可能超过integer的表示范围。在金融这种对精确度要求特别高的行业,这种错误更是不可忍受的。
- 返回给前端的json数据,尽量不要使用数值类型。如果你做过前端相关的项目,你会发现,当你使用json格式字符串给前端返回数值类型时,前端展示出来的数字可能跟你返回的数字完全不一样。其根本原因就是Javascript的浮点数没有办法精确表示较大数值。
2、认识浮点数规律
关于浮点数的几个规律和建议:
- Javascript中的数字都是双精度浮点数。
- 在浮点数中,0有+0和-0两种表示方法。
- 浮点数表示的值是不连续的,不均匀的。越大的数,越无法用浮点数表示出来。
- 有近一半的浮点数数值分布在-1和+1之间。
- 不要用浮点数来生成随机数。
- 不要用浮点数来存储或计算有关金钱和资产方面的一切,包括常见的会员积分。不能用浮点数用于任何需要精确值的运算,因为浮点数无法精确的表示数字,比如说0.1就无法用浮点数精确表示出来。
3、浮点数的二进制转换
浮点数二进制表达的三个主要成分是:
- Sign(1bit):表示浮点数是正数还是负数。0表示正数,1表示负数。
- Exponent(8bits):指数部分。类似于科学技术法中的M*10^N中的N,只不过这里是以2为底数而不是10。需要注意的是,这部分中是以2^7-1即127,也即01111111代表2^0,转换时需要根据127作偏移调整。
- Mantissa(23bits):基数部分。浮点数具体数值的实际表示。
转换过程:
- 改写整数部分:以数值5.2为例。先不考虑指数部分,我们先单纯的将十进制数改写成二进制。整数部分很简单,5.即101.。
- 改写小数部分:小数部分我们相当于拆成是2^-1一直到2^-N的和。例如:0.2 = 0.125+0.0625+0.007825+0.00390625,即2^-3+2^-4+2^-7+2^-8….,也即.00110011001100110011。
- 规格化:现在我们已经有了这么一串二进制101.00110011001100110011。然后我们要将它规格化,也叫Normalize。其实原理很简单就是保证小数点前只有一个bit。于是我们就得到了以下表示:1.0100110011001100110011 * 2^2。到此为止我们已经把改写工作完成,接下来就是要把bit填充到三个组成部分中去了。
- 填充:指数部分(Exponent):之前说过需要以127作为偏移量调整。因此2的2次方,指数部分偏移成2+127即129,表示成10000001填入。整数部分(Mantissa):除了简单的填入外,需要特别解释的地方是1.010011中的整数部分1在填充时被舍去了。因为规格化后的数值整部部分总是为1。那大家可能有疑问了,省略整数部分后岂不是1.010011和0.010011就混淆了么?其实并不会,如果你仔细看下后者,会发现他并不是一个规格化的二进制,可以改写成1.0011 * 2^-2。所以省略小数点前的一个bit不会造成任何两个浮点数的混淆。
延伸阅读1:什么是Denormalized Number
了解完浮点数的表达以后,不难看出浮点数的精度和指数范围有很大关系。最低不能低过2^-7-1较高不能高过2^8-1(其中剔除了指数部分全0喝全1的特殊情况)。那么当我们要表示一个例如:1.00001111*2^-7这样的超小数值的时候就无法用规格化数值表示,只能用0来代替。那么,这样做有什么问题呢?最容易理解的一种副作用就是:当多次做低精度浮点数舍弃的时候,就会出现除数为0的exception,导致异常。于是乎就出现了Denormalized Number(后称非规格化浮点)。他和规格浮点的区别在于,规格浮点约定小数点前一位默认是1。而非规格浮点约定小数点前一位可以为0,这样小数精度就相当于多了非常多2^22范围。