从「消失的 1 千粉丝」谈及 toFixed 的坑

时间 2020-06-15

标签消失粉丝谈及 tofixed 繁體版

原文原文链接

故事是这样的

小郑是某平台一位 UP 🐷，通过两年努力如今平台粉丝也有 994500 个了，距离冲击百万 UP 仅剩一步之遥。javascript

金主爸爸告诉他，只要百万，就让他接个大的广告单。html

奈何最近没有灵感，每天🕊，始终不涨粉。java

因而他便打起了歪主意，买粉！先到某宝上买了 1 千粉丝试试水，很快，对方说已到帐。git

小郑兴冲冲的上平台上一看，并无，仍是显示的 99.5 ，1 千个粉丝去哪了？？程序员

正准备投诉商家时，鼠标下滑看到了这样的一幕！web

具体粉丝数确实是正确的，按照小学教的的四舍五入，应该显示 99.6万 才对。浏览器

难道是平台的 bug ?不解的小郑打算向程序员朋友小盖询问，小盖一看：bash

「这应该是用了 toFixed 了吧，这方法有个坑。。容我细细道来」ecmascript

以上故事纯属虚构（包括图片）函数

toFixed 是什么

如下引自 MDN 的定义

numObj.toFixed(digits)
复制代码

返回指定 digits 位数的字符串，必要时会进行四舍五入。看如下例子

99.45.toFixed(1);   // "99.5"
99.99.toFixed(1);   // "100.0"
99.55.toFixed(1);   // "99.5" warning: 见下面解释
复制代码

是否是发现第三个例子不太对？

咱们知道，js 中的浮点数内部是用双精度 64位（double）表示的，采用的是 IEEE 754 表示法，

因此 99.55 实际是 99.549999999999997

网上有在线工具能够直接算出来

那么很明显能够看出来答案，四舍五入结果就是 99.5

so，获得答案了，本文结束?

咱们再看下 ecmascript 规范是怎么描述的

Number.prototype.toFixed ( fractionDigits )

关键看红色区域，咱们须要找个一个 n ，使其 n / 10 - 99.55 尽量接近零。找到 n 以后后面的结果就都肯定了。

（额，看起来好像很复杂的样子，不是直接对小数位四舍五入。。）

假设 n 为 995,则 m 为 "995", k = m.length = 3, a = "99", b = "5", 最终结果为 "99.5"

那么 n 是否是 995 呢？

知足 n / 10 - 99.55 尽量接近零这个条件的有两个数： 995,996 而他们的计算结果分别为：

995/10 - 99.55 // -0.04999999999999716
996/10 - 99.55 // 0.04999999999999716
复制代码

和 0 间的差值是同样的，选大的结果是 996 ，可咱们运行的结果倒是 99.5 ，这又是为什么？难道浏览器引擎的实现有误？或者没按规范实现？

对比了几个引擎，结果都是 995，咱们先看一哈 JavaScriptCore (Webkit 的 js 引擎) 实现

JavaScriptCore toFixed 源码

源码在 webkit/Source/JavaScriptCore/runtime/NumberPrototype.cpp 中的 numberProtoFuncToFixed 方法

在 JavaScriptCore 中，原型方法很好找，就是 xxxProtoFuncXxx 的结构

调试环境

（本小结能够选择略过，直接看后面的分析和小结）

在 macOS 上编译 webkit 比 v8 简单多了，详见 Setup and Debug JavaScriptCore / WebKit

经过如下命令进入 debug 环境

# 利用 lldb 调试 jsc
$ lldb ./WebKitBuild/Debug/bin/jsc
# 开始调试
(lldb) run
>>>
# control + c 再次进入 lldb
# 打断点, 断点方法输几个字符按 Tab 就能够出提示了
(lldb): b JSC::numberProtoFuncToFixed(JSC::JSGlobalObject*, JSC::CallFrame*)
(lldb): b WTF::double_conversion::FastFixedDtoa(double, int, WTF::double_conversion::BufferReference<char>, int*, int*) 
# 结束调试，切到 jsc, 须要按 2次回车
(lldb): c
# 输入 js 代码，回车进入 lldb 调试环境
>>> 99.55.toFixed(1)
# EncodedJSValue JSC_HOST_CALL numberProtoFuncToFixed(JSGlobalObject* globalObject, CallFrame* callFrame)
复制代码

jsc 经常使用指令

describe(x) #查看对象（js在 c 中均为对象） 的内部描述，结构，内存地址
复制代码

lldb 经常使用指令

加强插件 chisel ，更多使用方法后续写一篇文章，

x/8gx address #查看内存地址 address

next(n) #单步执行
step(s) #进入函数
continue(c) #将程序运行到结束或者断点处（进入下一断点）
finish #将程序运行到当前函数返回（从函数跳出）
breakpoint(b) 行号/函数名 <条件语句> #设置断点
fr v #查看局部变量信息
print(p) x #输出变量 x 的值
复制代码

源码分析

入口，各类状况的处理

EncodedJSValue JSC_HOST_CALL numberProtoFuncToFixed(JSGlobalObject* globalObject, CallFrame* callFrame) {
    VM& vm = globalObject->vm();
    auto scope = DECLARE_THROW_SCOPE(vm);

    // x 取值 99.549999999999997
    double x;
    if (!toThisNumber(vm, callFrame->thisValue(), x))
        return throwVMToThisNumberError(globalObject, scope, callFrame->thisValue());

    // decimalPlaces 取值 1
    int decimalPlaces = static_cast<int>(callFrame->argument(0).toInteger(globalObject));
    RETURN_IF_EXCEPTION(scope, { });

    // 特殊处理，略
    if (decimalPlaces < 0 || decimalPlaces > 100)
        return throwVMRangeError(globalObject, scope, "toFixed() argument must be between 0 and 100"_s);

    // x 的特殊处理，略
    if (!(fabs(x) < 1e+21))
        return JSValue::encode(jsString(vm, String::number(x)));

    // NaN or Infinity 的特殊处理
    ASSERT(std::isfinite(x));

    // 进入执行 number=99.549999999999997, decimalPlaces=1
    return JSValue::encode(jsString(vm, String::numberToStringFixedWidth(x, decimalPlaces)));
}
复制代码

从 numberToStringFixedWidth 方法不断进入，到达 FastFixedDtoa 处理方法

须要注意的是，原数值的整数和小数部分都分别采用了指数表示法，方便后面位运算处理

99.549999999999997 = 7005208482886451 * 2 ** -46 = 99 + 38702809297715 * 2 ** -46

// FastFixedDtoa(v=99.549999999999997, fractional_count=1, buffer=(start_ = "", length_ = 122), length=0x00007ffeefbfd488, decimal_point=0x00007ffeefbfd494)

bool FastFixedDtoa(double v,
                   int fractional_count,
                   BufferReference<char> buffer,
                   int* length,
                   int* decimal_point) {
  const uint32_t kMaxUInt32 = 0xFFFFFFFF;
  // 将 v 表示成 尾数(significand) × 底数(2) ^ 指数(exponent) 
  // 7005208482886451 x 2 ^ -46
  uint64_t significand = Double(v).Significand();
  int exponent = Double(v).Exponent();

  // 省略部分代码

  if (exponent + kDoubleSignificandSize > 64) {
    // ...
  } else if (exponent >= 0) {
    // ...
  } else if (exponent > -kDoubleSignificandSize) {
    // exponent > -53 的状况, 切割数字

    // 整数部分: integrals = 7005208482886451 >> 46 = 99 
    uint64_t integrals = significand >> -exponent;
    // 小数部分(指数表达法的尾数部分): fractionals = 7005208482886451 - 99 << 46 = 38702809297715
    // 指数不变 -46
    // 38702809297715 * (2 ** -46) = 0.5499999999999972
    uint64_t fractionals = significand - (integrals << -exponent);
    if (integrals > kMaxUInt32) {
      FillDigits64(integrals, buffer, length);
    } else {
      // buffer 中放入 "99"
      FillDigits32(static_cast<uint32_t>(integrals), buffer, length);
    }
    *decimal_point = *length;
    // 填充小数部分，buffer 为 "995"
    FillFractionals(fractionals, exponent, fractional_count,
                    buffer, length, decimal_point);
  } else if (exponent < -128) {
    // ...
  } else {
    // ...
  }
  TrimZeros(buffer, length, decimal_point);
  buffer[*length] = '\0';
  if ((*length) == 0) {
    // The string is empty and the decimal_point thus has no importance. Mimick
    // Gay's dtoa and and set it to -fractional_count.
    *decimal_point = -fractional_count;
  }
  return true;
}

复制代码

FillFractionals 用来填充小数部分，取几位，是否进位都在该方法中处理

// FillFractionals(fractionals=38702809297715, exponent=-46, fractional_count=1, buffer=(start_ = "99���", length_ = 122), length=0x00007ffeefbfd488, decimal_point=0x00007ffeefbfd494)


/* 小数部分的二进制表示法： fractionals * 2 ^ -exponent 38702809297715 * (2 ** -46) = 0.5499999999999972 前提： -128 <= exponent <=0。 0 <= fractionals * 2 ^ exponent < 1 buffer 能够保存结果 此函数将舍入结果。在舍入过程当中，此函数未生成的数字可能会更新，且小数点变量可能会更新。若是此函数生成数字 99，而且缓冲区已经包含 “199”（所以产生的缓冲区为“19999”），则向上舍入会将缓冲区的内容更改成 “20000”。 */
static void FillFractionals(uint64_t fractionals, int exponent, int fractional_count, BufferReference<char> buffer, int* length, int* decimal_point) {
  ASSERT(-128 <= exponent && exponent <= 0);
  if (-exponent <= 64) { 
    ASSERT(fractionals >> 56 == 0);
    int point = -exponent; // 46

    // 每次迭代，将小数乘以10，去除整数部分放入 buffer

    for (int i = 0; i < fractional_count; ++i) { // 0->1
      if (fractionals == 0) break;

      // fractionals 乘以 5 而不是乘以 10 ，并调整 point 的位置，这样， fractionals 变量将不会溢出。而后总体至关于乘以 10
      // 不会溢出的验证过程：
      // 循环初始： fractionals < 2 ^ point , point <= 64 且 fractionals < 2 ^ 56
      // 每次迭代后， point-- 。
      // 注意 5 ^ 3 = 125 < 128 = 2 ^ 7。
      // 所以，此循环的三个迭代不会溢出 fractionals （即便在循环体末尾没有减法）。
      // 与此同时 point 将知足 point <= 61，所以 fractionals < 2 ^ point ，而且 fractionals 再乘以 5 将不会溢出(<int64)。


      // 该操做不会溢出，证实见上方
      fractionals *= 5; // 193514046488575
      point--; // 45
      int digit = static_cast<int>(fractionals >> point); // 193514046488575 * 2 ** -45 = 5
      ASSERT(digit <= 9);
      buffer[*length] = static_cast<char>('0' + digit); // '995'
      (*length)++;
      // 去掉整数位
      fractionals -= static_cast<uint64_t>(digit) << point; // 193514046488575 - 5 * 2 ** 45 = 17592186044415 
      // 17592186044415 * 2 ** -45 = 0.4999999999999716 
    }
    // 看小数的下一位是否值得让 buffer 中元素进位
    // 经过乘2看是否能 >=1 来判断
    ASSERT(fractionals == 0 || point - 1 >= 0);
    // 本例中 17592186044415 >> 44 = 17592186044415 * 2 ** -44 = 0.9999999999999432 , & 1 = 0
    if ((fractionals != 0) && ((fractionals >> (point - 1)) & 1) == 1) {
      RoundUp(buffer, length, decimal_point);
    }
  } else {  // We need 128 bits.
    // ...
  }
}


复制代码

这样就获得了 995 ，即规范描述中的 n ，后面插入一个小数点即为最终结果 99.5

小结

js 引擎并无按规范中说的，去寻找一个 n ，使其 n / (10 ^ f) 尽量等于 x ，感受这样效率太慢了。而是直接将 x 分为整数和小数部分，并采用指数表示法分别进行计算。

处理小数的时候，其实就是让小数点右移。用指数表示法的时候，其中有个细节就是考虑了底数直接 *10 可能会致使溢出，而后采用了 底数 *5 ，指数递减 的方式，注释中给出了证实。在 f 位计算后，最后再计算下一位，看是否须要进位。

固然，最终结果不符合咱们平常的计算，核心仍是在于 IEEE 754 表示法

99.55 在调试初期取值就是 99.549999999999997 了

所以，之后用 toFixed 方法的时候，要是担忧没有正常四舍五入，就先去在线工具上查看看

V8 toFixed 源码

v8 toFixed

入口在这，就再也不分析了，和 JavaScriptCore 大同小异，感兴趣的读者能够自行查看

// ES6 section 20.1.3.3 Number.prototype.toFixed ( fractionDigits )
BUILTIN(NumberPrototypeToFixed) {

  // ... 省略参数解析，拆包，类型判断
  
  // value_number 和 fraction_digits_number 即为咱们目标值
  // 假设 value_number = 99.55, fraction_digits_number = 1.0
  double const value_number = value->Number();
  double const fraction_digits_number = fraction_digits->Number();

  // ... 省略范围检查

  // ... 省略 value_number 特殊值处理： Infinity NaN

  // 实际处理方法 DoubleToFixedCString
  char* const str = DoubleToFixedCString(
      value_number, static_cast<int>(fraction_digits_number));
  Handle<String> result = isolate->factory()->NewStringFromAsciiChecked(str);
  DeleteArray(str);
  return *result;
}
复制代码

正确的「四舍五入」

那如何写出一个符合常理的四舍五入方法呢？咱们能够借助 Math.round 方法实现

Math.round(x)

给定数字的值 x 四舍五入到最接近的整数。

若是 x 的小数部分大于 0.5，则舍入到相邻的绝对值更大的整数。
若是 x 的小数部分小于 0.5，则舍入到相邻的绝对值更小的整数。
若是参数的小数部分刚好等于0.5，则舍入到相邻的在正无穷（+∞）方向上的整数。

⚠️ 注意：与不少其余语言中的round()函数不一样，Math.round()并不老是舍入到远离0的方向（尤为是在负数的小数部分刚好等于0.5的状况下）。

举例

Math.round(99.51) // 100
Math.round(99.5) // 100
Math.round(99.49) //99
Math.round(-99.51) // -100
Math.round(-99.5) // -99
Math.round(-99.49) //-99 
复制代码

代码

// 注意，要用除法。若用乘法的话，乘以小数，该小数是不精确的 （仍是上面的缘由，ieee 754 表示法）
// 996 * 0.1 = 99.60000000000001
function round(number, precision=0) {
    return Math.round(+number + 'e' + precision) / (10 ** precision)
    //same as:
    //return Number(Math.round(+number + 'e' + precision) + 'e-' + precision);
}

round(99.55,1) // 99.6
round(-99.5,0) // -99
复制代码

对负数进行，好比 -99.5 四舍五入按其余平台处理，取值 -100

/** * * @param {*} number * @param {*} precision * @param {boolean} flag 负数四舍五入是否按远离 0 处理 */
function round(number, precision = 0, flag = false) {
    if (flag && number < 0) {
        return -round(Math.abs(number), precision)
    }
    return Math.round(+number + 'e' + precision) / (10 ** precision)
}
round(99.55,1) // 99.6
round(-99.55,1) // -99.5
round(-99.55,1,true) // -99.6
复制代码

以前想说还须要考虑溢出，由于发现咱们本身实现的 round 和 toFixed 都不符合预期

round(999999999955.2376236232, 6) // 999999999955.2378
999999999955.2376236232.toFixed(6) // "999999999955.237671
复制代码

后来发现 999999999955.2376236232 这个数字在 64 位中就没法表示了，只能表示为 9.999999999552376708984375e11

因此，溢出的例子咱们就不考虑了。

PS: 处理时发现的一个方法 Math.trunc 能够直接拿到整数部分，无论正负，不像 Math.floor 对于负数会向下取整

回到问题，平台如何修复这个bug

平台上的粉丝数显示听从这样几个原则：

小于 1 万，直接显示
小于 1 亿，四舍五入保留一位小数，若小数部分为 0 ，则不显示
大于等于 1 亿，四舍五入保留一位小数，若小数部分为 0 ，则不显示

利用刚刚写的 round 函数操做一波

function round(number, precision = 0, flag = false) {
    if (flag && number < 0) {
        return -round(Math.abs(number), precision)
    }
    return Math.round(+number + 'e' + precision) / (10 ** precision)
}
const formatNumForAvatar = num => {
    if (num >= 1e+8) {
        return {
            num: round(num / 1e+8, 1),
            unit: '亿'
        }
    }
    if (num >= 1e+4) {
        return {
            num: round(num / 1e+4, 1),
            unit: "万"
        }
    }
    return {
        num: num <= 0 ? 0 : num
    }
}
/** * 测试用例 */

formatNumForAvatar(9999) // {num: 9999}
formatNumForAvatar(99999) // {num: 10, unit: "万"}
formatNumForAvatar(995500) // {num: 99.6, unit: "万"}
formatNumForAvatar(99999900) // {num: 10000, unit: "万"}
formatNumForAvatar(109999900) // {num: 1.1, unit: "亿"}
复制代码

仍是有问题，没有处理好 10000 万 这种 case

目前想到的就是增长判断条件，或者硬编码

function round(number, precision = 0, flag = false) {
    if (flag && number < 0) {
        return -round(Math.abs(number), precision)
    }
    return Math.round(+number + 'e' + precision) / (10 ** precision)
}
const formatNumForAvatar = num => {
    // 处理 99995000+ 的状况
    if (num >= 1e+8 - 5000) {
        return {
            num: round(num / 1e+8, 1),
            unit: '亿'
        }
    }
    if (num >= 1e+4) {
        return {
            num: round(num / 1e+4, 1),
            unit: "万"
        }
    }
    return {
        num: num <= 0 ? 0 : num
    }
}
/** * 测试用例 */

formatNumForAvatar(9999) // {num: 9999}
formatNumForAvatar(99999) // {num: 10, unit: "万"}
formatNumForAvatar(995500) // {num: 99.6, unit: "万"}
formatNumForAvatar(99994999) // {num: 9999.5, unit: "万"}
formatNumForAvatar(99999900) // {num: 1, unit: "亿"}
formatNumForAvatar(109999900) // {num: 1.1, unit: "亿"}
复制代码

若是有其余更好的方式欢迎评论~

最后

从发现问题，到写下这篇文章拖了大概 2 周了，主要是以前对 JS 引擎调试彻底不了解

光搭建 v8 调试环境就花了好几个晚上，包括 macOS 上 gdb 的坑，V8 构建的坑，断点调试的坑，如何配合 vscode 等等... 后面会再出几篇文章讲这个，欢迎关注

若是是 macOS 上，建议仍是去看 JavaScriptCore 源码吧，这些基础方法实现，其实大部分和 V8 是同样的