JS魔法堂:完全理解0.1 + 0.2 === 0.30000000000000004的背后 基础野:细说原码、反码和补码 基础野:细说无符号整数 基础野:细说有符号整数 基础野:细说浮点数

Brief                              javascript

  一天有个朋友问我“JS中计算0.7 * 180怎么会等于125.99999999998,坑也太多了吧!”那时我猜想是二进制表示数值时发生round-off error所致使,但并不清楚具体是如何致使,而且有什么方法去规避。因而用了3周时间静下心把这个问题搞懂,在学习的过程当中还发现不只0.7 * 180==125.99999999998,还有如下的坑html

  1. 著名的 0.1 + 0.2 === 0.30000000000000004java

  2. 1000000000000000128 === 1000000000000000129git

 

IEEE 754 Floating-point                  github

  众所周知JS仅有Number这个数值类型,而Number采用的时IEEE 754 64位双精度浮点数编码。而浮点数表示方式具备如下特色:post

  1. 浮点数可表示的值范围比同等位数的整数表示方式的值范围要大得多;学习

  2. 浮点数没法精确表示其值范围内的全部数值,而有符号和无符号整数则是精确表示其值范围内的每一个数值;网站

  3. 浮点数只能精确表示m*2e的数值;编码

  4. 当biased-exponent为2e-1-1时,浮点数能精确表示该范围内的各整数值;url

  5. 当biased-exponent不为2e-1-1时,浮点数不能精确表示该范围内的各整数值。

  因为部分数值没法精确表示(存储),因而在运算统计后误差会愈见明显。

 

  想了解更多浮点数的知识可参考如下文章:

  基础野:细说原码、反码和补码(http://www.cnblogs.com/fsjohnhuang/p/5060242.html)

  基础野:细说无符号整数(http://www.cnblogs.com/fsjohnhuang/p/5078290.html)

  基础野:细说有符号整数(http://www.cnblogs.com/fsjohnhuang/p/5082829.html)

  基础野:细说浮点数(http://www.cnblogs.com/fsjohnhuang/p/5109766.html)

 

Why 0.1 + 0.2 === 0.30000000000000004 ?       

  在浮点数运算中产生偏差值的示例中,最出名应该是0.1 + 0.2 === 0.30000000000000004了,到底有多有名?看看这个网站就知道了http://0.30000000000000004.com/。也就是说不只是JavaScript会产生这种问题,只要是采用IEEE 754 Floating-point的浮点数编码方式来表示浮点数时,则会产生这类问题。下面咱们来分析整个运算过程。

  1. 0.1 的二进制表示为 1.1001100110011001100110011001100110011001100110011001 1(0011)+ * 2^-4;

  2. 当64bit的存储空间没法存储完整的无限循环小数,而IEEE 754 Floating-point采用round to nearest, tie to even的舍入模式,所以0.1实际存储时的位模式是0-01111111011-1001100110011001100110011001100110011001100110011010;

  3. 0.2 的二进制表示为 1.1001100110011001100110011001100110011001100110011001 1(0011)+ * 2^-3;

  4. 当64bit的存储空间没法存储完整的无限循环小数,而IEEE 754 Floating-point采用round to nearest, tie to even的舍入模式,所以0.2实际存储时的位模式是0-01111111100-1001100110011001100110011001100110011001100110011010;

  5. 实际存储的位模式做为操做数进行浮点数加法,获得 0-01111111101-0011001100110011001100110011001100110011001100110100。转换为十进制即为0.30000000000000004。

     

Why 0.7 * 180===125.99999999998 ?          

  1. 0.7实际存储时的位模式是0-01111111110-0110011001100110011001100110011001100110011001100110;

  2. 180实际存储时的位模式是0-10000000110-0110100000000000000000000000000000000000000000000000;

  3. 实际存储的位模式做为操做数进行浮点数乘法,获得0-10000000101-1111011111111111111111111111111111111111101010000001。转换为十进制即为125.99999999998。

 

Why 1000000000000000128 === 1000000000000000129 ?      

  1. 1000000000000000128实际存储时的位模式是0-10000111010-1011110000010110110101100111010011101100100000000001;

  2. 1000000000000000129实际存储时的位模式是0-10000111010-1011110000010110110101100111010011101100100000000001;

  3. 所以1000000000000000128和1000000000000000129的实际存储的位模式是同样的。

 

Solution                            

  到这里咱们都理解只要采起IEEE 754 FP的浮点数编码的语言均会出现上述问题,只是它们的标准类库已经为咱们提供了解决方案而已。而JS呢?显然没有。坏处天然是掉坑了,而好处偏偏也是掉坑了:)

  针对不一样的应用需求,咱们有不一样的实现方式。

  Solution 0x00 - Simple implementation

    对于小数和小整数的简单运算可用以下方式

function numAdd(num1/*:String*/, num2/*:String*/) { 
    var baseNum, baseNum1, baseNum2; 
    try { 
        baseNum1 = num1.split(".")[1].length; 
    } catch (e) { 
        baseNum1 = 0; 
    } 
    try { 
        baseNum2 = num2.split(".")[1].length; 
    } catch (e) { 
        baseNum2 = 0;
    } 
    baseNum = Math.pow(10, Math.max(baseNum1, baseNum2)); 
    return (num1 * baseNum + num2 * baseNum) / baseNum; 
};

  Solution 0x01 - math.js

     若须要复杂且全面的运算功能那必须上math.js,其内部引用了decimal.jsfraction.js。功能异常强大,用于生产环境上妥妥的!

  Solution 0x02 - D.js

     D.js算是个人练手项目吧,截止本文发表时D.js版本为V0.2.0,仅实现了加、减、乘和整除运算而已,bug是一堆堆的,但至少解决了0.1+0.2的问题了。

var sum = D.add(0.1, 0.2)
console.log(sum + '') // 0.3

var product = D.mul("1e-2", "2e-4")
console.log(product + '') // 0.000002

var quotient = D.div(-3, 2)
console.log(quotient + '') // -(1+1/2)

解题思路:

    1. 因为仅位于Number.MIN_SAFE_INTEGER和Number.MAX_SAFE_INTEGER间的整数才能被精准地表示,也就是只要保证运算过程的操做数和结果均落在这个阀值内,那么运算结果就是精准无误的;

    2. 问题的关键落在如何将小数和极大数转换或拆分为Number.MIN_SAFE_INTEGER至Number.MAX_SAFE_INTEGER阀值间的数了;

    3. 小数转换为整数,天然就是经过科学计数法表示,并经过右移小数点,减少幂的方式处理;(如0.000123 等价于 123 * 10-6)

    4. 而极大数则须要拆分,拆分的规则是多样的。

        4.1. 按因式拆分:假设对12345进行拆分获得 5 * 2469;

        4.2. 按位拆分:假设以3个数值为一组对12345进行拆分获得345和12,而实际值为12*1000 + 345。

        就我而言,4.1的拆分规则结构不稳定,并且不直观;而4.2的规则直观,且拆分和恢复的公式固定。

    5. 余数由符号位、分子和分母组成,而符号与整数部分一致,所以只需考虑如何表示分子和分母便可。

    6. 无限循环数则仅需考虑如何表示循环数段便可。(如10.2343434则分红10.23 和循环数34和34的权重便可)

获得编码规则后,那就剩下基于指定编码如何实现各类运算的问题了。

    1. 基于上述的数值编码规则如何实现加、减运算呢?

    2. 基于上述的数值编码规则如何实现乘、除运算呢?(其实只要加、减运算解决了,乘除必然可解,就是效率问题而已)

    3. 基于上述的数值编码规则如何实现其它如sin、tan、%等数学运算呢?

另外因为涉及数学运算,那么将做为add、sub、mul和div等入参的变量保持如同数学公式运算数般纯净(Persistent/Immutable Data Structure)是必须的,那是否还要引入immutable.js呢?(D.js如今采用按需生成副本的方式,可预见随着代码量的增长,这种方式会致使总体代码没法维护)

 

Conclusion                           

  依照个人尿性,D.js将采起不按期持续更新的策略(待我理解Persistent/Immutable Data Structure后吧:))。欢迎各位指教!

  尊重原创,转载请注明来自:http://www.cnblogs.com/fsjohnhuang/p/5115672.html^_^肥子John

 

Thanks                              

http://es5.github.io

https://github.com/MikeMcl/decimal.js/

http://www.ruanyifeng.com/blog/2010/06/ieee_floating-point_representation.html

http://demon.tw/copy-paste/javascript-precision.html

相关文章
相关标签/搜索