抓住数据的小尾巴 - JS浮点数陷阱及解法

时间 2019-11-05

原文原文链接

原发于知乎专栏：zhuanlan.zhihu.com/ne-fehtml

众所周知，JavaScript 浮点数运算时常常遇到会 0.000000001 和 0.999999999 这样奇怪的结果，如 0.1+0.2=0.30000000000000004、1-0.9=0.09999999999999998，不少人知道这是浮点数偏差问题，但具体缘由就说不清楚了。本文帮你理清这背后的原理以及解决方案，还会向你解释JS中的大数危机和四则运算中会遇到的坑。git

浮点数的存储

首先要搞清楚 JavaScript 如何存储小数。和其它语言如 Java 和 Python 不一样，JavaScript 中全部数字包括整数和小数都只有一种类型 — Number。它的实现遵循 IEEE 754 标准，使用 64 位固定长度来表示，也就是标准的 double 双精度浮点数（相关的还有float 32位单精度）。计算机组成原理中有过详细介绍，若是你不记得也不要紧。github

注：大多数语言中的小数默认都是遵循 IEEE 754 的 float 浮点数，包括 Java、Ruby、Python，本文中的浮点数问题一样存在。浏览器

这样的存储结构优势是能够归一化处理整数和小数，节省存储空间。bash

64位比特又可分为三个部分：函数

符号位S：第 1 位是正负数符号位（sign），0表明正数，1表明负数
指数位E：中间的 11 位存储指数（exponent），用来表示次方数
尾数位M：最后的 52 位是尾数（mantissa），超出的部分自动进一舍零

实际数字就能够用如下公式来计算：性能

注意以上的公式遵循科学计数法的规范，在十进制中 0<M<10，到二进制就是 0<M<2。也就是说整数部分只能是1，因此能够被舍去，只保留后面的小数部分。如 4.5 转成二进制就是 100.1，科学计数法表示是 1.001*2^2，舍去1后 M = 001。E是一个无符号整数，由于长度是11位，取值范围是 0~2047。可是科学计数法中的指数是能够为负数的，因此约定减去一个中间数 1023，[0,1022] 表示为负，[1024,2047] 表示为正。如 4.5 的指数 E = 1025，尾数 M = 001。测试

最终的公式变成：ui

因此 4.5 最终表示为（M=00一、E=1025）：spa

(图片由今生成 www.binaryconvert.com/convert_dou…)

下面再以 0.1 为例解释浮点偏差的缘由，0.1 转成二进制表示为 0.0001100110011001100(1100循环)，1.100110011001100x2^-4，因此 E=-4+1023=1019；M 舍去首位的1，获得 100110011...。最终就是：

转化成十进制后为 0.100000000000000005551115123126，所以就出现了浮点偏差。

为何 `0.1+0.2=0.30000000000000004`？

计算步骤为：

// 0.1 和 0.2 都转化成二进制后再进行运算
0.00011001100110011001100110011001100110011001100110011010 +
0.0011001100110011001100110011001100110011001100110011010 =
0.0100110011001100110011001100110011001100110011001100111

// 转成十进制正好是 0.30000000000000004复制代码

为何 `x=0.1` 能获得 `0.1`？

恭喜你到了看山不是山的境界。由于 mantissa 固定长度是 52 位，再加上省略的一位，最多能够表示的数是 2^53=9007199254740992，对应科学计数尾数是 9.007199254740992，这也是 JS 最多能表示的精度。它的长度是 16，因此能够近似使用 toPrecision(16) 来作精度运算，超过的精度会自动作凑整处理。因而就有：

0.10000000000000000555.toPrecision(16)
// 返回 0.1000000000000000，去掉末尾的零后正好为 0.1

// 但你看到的 `0.1` 实际上并非 `0.1`。不信你可用更高的精度试试：
0.1.toPrecision(21) = 0.100000000000000005551复制代码

大数危机

可能你已经隐约感受到了，若是整数大于 9007199254740992 会出现什么状况呢？
因为 E 最大值是 1023，因此最大能够表示的整数是 2^1024 - 1，这就是能表示的最大整数。但你并不能这样计算这个数字，由于从 2^1024 开始就变成了 Infinity

> Math.pow(2, 1023)
8.98846567431158e+307

> Math.pow(2, 1024)
Infinity复制代码

那么对于 (2^53, 2^63) 之间的数会出现什么状况呢？

(2^53, 2^54) 之间的数会两个选一个，只能精确表示偶数
(2^54, 2^55) 之间的数会四个选一个，只能精确表示4个倍数
... 依次跳过更多2的倍数

下面这张图能很好的表示 JavaScript 中浮点数和实数（Real Number）之间的对应关系。咱们经常使用的 (-2^53, 2^53) 只是最中间很是小的一部分，越往两边越稀疏越不精确。

在淘宝早期的订单系统中把订单号看成数字处理，后来随意订单号暴增，已经超过了
9007199254740992，最终的解法是把订单号改为字符串处理。

要想解决大数的问题你能够引用第三方库 bignumber.js，原理是把全部数字看成字符串，从新实现了计算逻辑，缺点是性能比原生的差不少，因此原生支持大数就颇有必要了。TC39 已经有一个 Stage 3 的提案 proposal bigint，大数问题有望完全解决。在浏览器正式支持前，可使用 Babel 7.0 来实现，它的内部是自动转换成 big-integer 来计算，这样能保持精度但运算效率会下降。

`toPrecision` vs `toFixed`

数据处理时，这两个函数很容易混淆。它们的共同点是把数字转成字符串供展现使用。注意在计算的中间过程不要使用，只用于最终结果。

不一样点就须要注意一下：

toPrecision 是处理精度，精度是从左至右第一个不为0的数开始数起。
toFixed 是小数点后指定位数取整，从小数点开始数起。

二者都能对多余数字作凑整处理，也有些人用 toFixed 来作四舍五入，但必定要知道它是有 Bug 的。

如：1.005.toFixed(2) 返回的是 1.00 而不是 1.01。

缘由： 1.005 实际对应的数字是 1.00499999999999989，在四舍五入时所有被舍去！

解法：使用四舍五入函数 Math.round() 来处理。但 Math.round(1.005 * 100) / 100 仍是不行，由于 1.005 * 100 = 100.49999999999999。还须要把乘法和除法精度偏差都解决后再使用 Math.round。可使用后面介绍的 number-precision#round 方法来解决。

解决方案

回到最关心的问题：如何解决浮点偏差。首先，理论上用有限的空间来存储无限的小数是不可能保证精确的，但咱们能够处理一下获得咱们指望的结果。

数据展现类

当你拿到 1.4000000000000001 这样的数据要展现时，建议使用 toPrecision 凑整并 parseFloat 转成数字后再显示，以下：

parseFloat(1.4000000000000001.toPrecision(12)) === 1.4  // True复制代码

封装成方法就是：

function strip(num, precision = 12) {
  return +parseFloat(num.toPrecision(precision));
}复制代码

为何选择 12 作为默认精度？这是一个经验的选择，通常选12就能解决掉大部分0001和0009问题，并且大部分状况下也够用了，若是你须要更精确能够调高。

数据运算类

对于运算类操做，如 +-*/，就不能使用 toPrecision 了。正确的作法是把小数转成整数后再运算。以加法为例：

/** * 精确加法 */
function add(num1, num2) {
  const num1Digits = (num1.toString().split('.')[1] || '').length;
  const num2Digits = (num2.toString().split('.')[1] || '').length;
  const baseNum = Math.pow(10, Math.max(num1Digits, num2Digits));
  return (num1 * baseNum + num2 * baseNum) / baseNum;
}复制代码

以上方法能适用于大部分场景。遇到科学计数法如 2.3e+1（当数字精度大于21时，数字会强制转为科学计数法形式显示）时还须要特别处理一下。

能读到这里，说明你很是有耐心，那我就放个福利吧。遇到浮点数偏差问题时能够直接使用
github.com/dt-fe/numbe…

完美支持浮点数的加减乘除、四舍五入等运算。很是小只有1K，远小于绝大多数同类库（如Math.js、BigDecimal.js），100%测试全覆盖，代码可读性强，不妨在你的应用里用起来！

参考

若是你以为本文对你有帮助，请猛击喜欢鼓励一下