JSON.stringify()
在浏览器端或服务端,JSON.stringify()
都是咱们很经常使用的方法:html
在一些性能敏感的场合下(例如服务端处理大量并发),或面对大量 stringify 的操做时,咱们会但愿它的性能更好,速度更快。这也催生了一些优化的 stringify 方案/库,下图是它们与原生方法的性能对比:git
绿色部分时原生JSON.stringify()
,可见性能相较这些库都要低不少。那么,在大幅的性能提高背后的技术原理是什么呢?github
stringify
更快的 stringify
因为 JavaScript 是动态性很强的语言,因此对于一个 Object 类型的变量,其包含的键名、键值、键值类型最终只能在运行时肯定。所以,执行JSON.stringify()
时会有不少工做要作。在一无所知的状况下,咱们想要大幅优化显然无能为力。正则表达式
那么若是咱们知道这个 Object 中的键名、键值信息呢 —— 也就是知道它的结构信息,这会有帮助么?json
看个例子:数组
下面这个 Object,浏览器
const obj = {
name: 'alienzhou',
status: 6,
working: true
};
复制代码
咱们对它应用JSON.stringify()
,获得结果为安全
JSON.stringify(obj);
// {"name":"alienzhou","status":6,"working":true}
复制代码
如今若是咱们知道这个obj
的结构是固定的:并发
那么其实,我能够建立一个“定制化”的 stringify 方法app
function myStringify(o) {
return (
'{"name":"'
+ o.name
+ '","status":'
+ o.status
+ ',"isWorking":'
+ o.working
+ '}'
);
}
复制代码
看看咱们的myStringify
方法的输出:
myStringify({
name: 'alienzhou',
status: 6,
working: true
});
// {"name":"alienzhou","status":6,"isWorking":true}
myStringify({
name: 'mengshou',
status: 3,
working: false
});
// {"name":"mengshou","status":3,"isWorking":false}
复制代码
能够获得正确的结果,但只用到了类型转换和字符串拼接,因此“定制化”方法可让“stringify”更快。
总结来看,如何获得比 stringify
更快的 stringify
方法呢?
stringify
方法,其内部实际是经过字符串拼接生成结果的;这也是大多数 stringify 加速库的套路,转化为代码就是相似:
import faster from 'some_library_faster_stringify';
// 1. 经过相应规则,定义你的对象结构
const theObjectScheme = {
// ……
};
// 2. 根据结构,获得一个定制化的方法
const stringify = faster(theObjectScheme);
// 3. 调用方法,快速 stringify
const target = {
// ……
};
stringify(target);
复制代码
根据上面的分析,核心功能在于,根据其结构信息,为该类对象建立“定制化”的stringify方法,其内部实际是简单的属性访问与字符串拼接。
为了了解具体的实现方式,下面我以两个实现上略有差别的开源库为例来简单介绍一下。
下图是根据 fast-json-stringify 提供的 benchmark 结果,整理出来的性能对比。
能够看到,在大多数场景下具有2-5倍的性能提高。
fast-json-stringify 使用了 JSON Schema Validation 来定义(JSON)对象的数据格式。其 scheme 定义的结构自己也是 JSON 格式的,例如对象
{
name: 'alienzhou',
status: 6,
working: true
}
复制代码
对应的 scheme 就是:
{
title: 'Example Schema',
type: 'object',
properties: {
name: {
type: 'string'
},
status: {
type: 'integer'
},
working: {
type: 'boolean'
}
}
}
复制代码
其 scheme 定义规则丰富,具体使用能够参考 Ajv 这个 JSON 校验库。
fast-json-stringify 会根据刚才定义的 scheme,拼接生成出实际的函数代码字符串,而后使用 Function 构造函数在运行时动态生成对应的 stringify 函数。
在代码生成上,首先它会注入预先定义好的各种工具方法,这一部分不一样的 scheme 都是同样的:
var code = ` 'use strict' `
code += ` ${$asString.toString()} ${$asStringNullable.toString()} ${$asStringSmall.toString()} ${$asNumber.toString()} ${$asNumberNullable.toString()} ${$asIntegerNullable.toString()} ${$asNull.toString()} ${$asBoolean.toString()} ${$asBooleanNullable.toString()} `
复制代码
其次,就会根据 scheme 定义的具体内容生成 stringify 函数的具体代码。而生成的方式也比较简单:经过遍历 scheme。
遍历 scheme 时,根据定义的类型,在对应代码处插入相应的工具函数用于键值转换。例如上面例子中name
这个属性:
var accessor = key.indexOf('[') === 0 ? sanitizeKey(key) : `['${sanitizeKey(key)}']`
switch (type) {
case 'null':
code += ` json += $asNull() `
break
case 'string':
code += nullable ? `json += obj${accessor} === null ? null : $asString(obj${accessor})` : `json += $asString(obj${accessor})`
break
case 'integer':
code += nullable ? `json += obj${accessor} === null ? null : $asInteger(obj${accessor})` : `json += $asInteger(obj${accessor})`
break
……
复制代码
上面代码中的code
变量保存的就是最后生成的函数体的代码串。因为在 scheme 定义中,name
为string
类型,且不为空,因此会在code
中添加以下一段代码字符串:
"json += $asString(obj['name'])"
复制代码
因为还须要处理数组、及联对象等复杂状况,实际的代码省略了不少。
而后,生成的完整的code
字符串大体以下:
function $asString(str) {
// ……
}
function $asStringNullable(str) {
// ……
}
function $asStringSmall(str) {
// ……
}
function $asNumber(i) {
// ……
}
function $asNumberNullable(i) {
// ……
}
/* 以上是一系列通用的键值转换方法 */
/* $main 就是 stringify 的主体函数 */
function $main(input) {
var obj = typeof input.toJSON === 'function'
? input.toJSON()
: input
var json = '{'
var addComma = false
if (obj['name'] !== undefined) {
if (addComma) {
json += ','
}
addComma = true
json += '"name":'
json += $asString(obj['name'])
}
// …… 其余属性(status、working)的拼接
json += '}'
return json
}
return $main
复制代码
最后,将code
字符串传入 Function 构造函数来建立相应的 stringify 函数。
// dependencies 主要用于处理包含 anyOf 与 if 语法的状况
dependenciesName.push(code)
return (Function.apply(null, dependenciesName).apply(null, dependencies))
复制代码
slow-json-stringify 虽然名字叫 "slow",但实际上是一个 "fast" 的 stringify 库(命名很调皮)。
The slowest stringifier in the known universe. Just kidding, it's the fastest (:
它的实现比前面提到的 fast-json-stringify 更轻量级,思路也很巧妙。同时它在不少场景下效率会比 fast-json-stringify 更快。
slow-json-stringify 的 scheme 定义更天然与简单,主要就是将键值替换为类型描述。仍是上面这个对象的例子,scheme 会变为
{
name: 'string',
status: 'number',
working: 'boolean'
}
复制代码
确实很是直观。
不知道你注意到没有
// scheme
{
name: 'string',
status: 'number',
working: 'boolean'
}
// 目标对象
{
name: 'alienzhou',
status: 6,
working: true
}
复制代码
scheme 和原对象的结构是否是很像?
这种 scheme 的巧妙之处在于,这样定义以后,咱们能够先把 scheme JSON.stringify
一下,而后“扣去”全部类型值,最后等着咱们的就是把实际的值直接填充到 scheme 对应的类型声明处。
具体如何操做呢?
首先,能够直接对 scheme 调用JSON.stringify()
来生成基础模版,同时借用JSON.stringify()
的第二个参数来做为遍历方法收集属性的访问路径:
let map = {};
const str = JSON.stringify(schema, (prop, value) => {
const isArray = Array.isArray(value);
if (typeof value !== 'object' || isArray) {
if (isArray) {
const current = value[0];
arrais.set(prop, current);
}
_validator(value);
map[prop] = _deepPath(schema, prop);
props += `"${prop}"|`;
}
return value;
});
复制代码
此时,map
里收集全部属性的访问路径。同时生成的props
能够拼接为匹配相应类型字符还的正则表达式,例如咱们这个例子里的正则表达式为/"name"|"status"|"working"|"(string|number|boolean|undef)"|\\[(.*?)\\]/
。
而后,根据正则表达式来顺序匹配这些属性,替换掉属性类型的字符串,换成统一的占位字符串"__par__"
,并基于"__par__"
拆分字符串:
const queue = [];
const chunks = str
.replace(regex, (type) => {
switch (type) {
case '"string"':
case '"undefined"':
return '"__par__"';
case '"number"':
case '"boolean"':
case '["array-simple"]':
case '[null]':
return '__par__';
default:
const prop = type.match(/(?<=\").+?(?=\")/)[0];
queue.push(prop);
return type;
}
})
.split('__par__');
复制代码
这样你就会获得chunks
和props
两个数组。chunks
里包含了被分割的 JSON 字符串。以例子来讲,两个数组分别以下
// chunks
[
'{"name":"',
'","status":"',
'","working":"',
'"}'
]
// props
[
'name',
'status',
'working'
]
复制代码
最后,因为 map 中保存了属性名与访问路径的映射,所以能够根据 prop 访问到对象中某个属性的值,循环遍历数组,将其与对应的 chunks 拼接便可。
从代码量和实现方式来看,这个方案会更轻便与巧妙,同时也不须要经过 Function、eval 等方式动态生成或执行函数。
虽然不一样库的实现有差别,但从总体思路上来讲,实现高性能 stringify 的方式都是同样的:
归根到底,它本质上是经过静态的结构信息将优化与分析前置了。
最后,仍是想提一下