走进chrome心里，了解V8引擎是如何工做的

时间 2021-08-13

标签前端程序员 chrome segmentfault 浏览器架构 ide 函数性能优化栏目 Chrome 繁體版

原文原文链接

做为一个前端程序员，天天上班的第一件事就是打开电脑，不禁自主的点开chrome浏览器，或是摸会儿鱼或是立马进入工做状态。接下来浏览器窗口就会陪伴着你度过一天的时光，正常到七八点钟，晚点就九十点钟，再晚点就陪你跨过一天，时刻关注着你的工做。做为一个忠诚陪伴你的伙伴，你扪心自问，你有认真的了解过它是如何工做的吗？你有走进过它的心里世界吗？前端

若是你也好奇过，那么请收看这期的《走进chrome心里，了解V8引擎是如何工做的》。程序员

V8是什么

在深刻了解一件事物以前，首先要知道它是什么。chrome

V8是一个由Google开源的采用C++编写的高性能JavaScript和WebAssembly引擎，应用在 Chrome和Node.js等中。它实现了ECMAScript和WebAssembly，运行在Windows 7及以上、macOS 10.12+以及使用x6四、IA-3二、ARM或MIPS处理器的Linux系统上。 V8能够独立运行，也能够嵌入到任何C++应用程序中。segmentfault

V8由来

接下来咱们来关心关心它如何诞生的，以及为何叫这个名字。浏览器

V8最初是由Lars Bak团队开发的，以汽车的V8发动机（有八个气缸的V型发动机）进行命名，预示着这将是一款性能极高的JavaScript引擎，在2008年9月2号同chrome一同开源发布。架构

为何须要V8

咱们写的JavaScript代码最终是要在机器中被执行的，但机器没法直接识别这些高级语言。须要通过一系列的处理，将高级语言转换成机器能够识别的的指令，也就是二进制码，交给机器执行。这中间的转换过程就是V8的具体工做。ide

接下来咱们就来详细的了解一下。函数

V8组成

首先来看一下V8的内部组成。V8的内部有不少模块，其中最重要的4个以下：性能

Parser: 解析器，负责将源代码解析成AST
Ignition: 解释器，负责将AST转换成字节码并执行，同时会标记热点代码
TurboFan: 编译器，负责将热点代码编译成机器码并执行
Orinoco: 垃圾回收器，负责进行内存空间回收

V8工做流程

如下是V8中几个重要模块的具体工做流程图。咱们逐个分析。优化

Parser解析器

Parser解析器负责将源代码转换成抽象语法树AST。在转换过程当中有两个重要的阶段：词法分析（Lexical Analysis）和语法分析（Syntax Analysis）。

词法分析

也称为分词，是将字符串形式的代码转换为标记（token）序列的过程。这里的token是一个字符串，是构成源代码的最小单位，相似于英语中单词。词法分析也能够理解成将英文字母组合成单词的过程。词法分析过程当中不会关心单词之间的关系。好比：词法分析过程当中可以将括号标记成token，但并不会校验括号是否匹配。

JavaScript中的token主要包含如下几种：

关键字：var、let、const等

标识符：没有被引号括起来的连续字符，多是一个变量，也多是 if、else 这些关键字，又或者是 true、false 这些内置常量

运算符： +、-、 *、/ 等

数字：像十六进制，十进制，八进制以及科学表达式等

字符串：变量的值等

空格：连续的空格，换行，缩进等

注释：行注释或块注释都是一个不可拆分的最小语法单元

标点：大括号、小括号、分号、冒号等

如下是const a = 'hello world'通过esprima词法分析后生成的tokens。

[
    {
        "type": "Keyword",
        "value": "const"
    },
    {
        "type": "Identifier",
        "value": "a"
    },
    {
        "type": "Punctuator",
        "value": "="
    },
    {
        "type": "String",
        "value": "'hello world'"
    }
]

语法分析

语法分心是将词法分析产生的token按照某种给定的形式文法转换成AST的过程。也就是把单词组合成句子的过程。在转换过程当中会验证语法，语法若是有错的话，会抛出语法错误。

上述const a = 'hello world'通过语法分析后生成的AST以下：

{
  "type": "Program",
  "body": [
    {
      "type": "VariableDeclaration",
      "declarations": [
        {
          "type": "VariableDeclarator",
          "id": {
            "type": "Identifier",
            "name": "a"
          },
          "init": {
            "type": "Literal",
            "value": "hello world",
            "raw": "'hello world'"
          }
        }
      ],
      "kind": "const"
    }
  ],
  "sourceType": "script"
}

通过Parser解析器生成的AST将交由Ignition解释器进行处理。

Ignition解释器

Ignition解释器负责将AST转换成字节码（Bytecode）并执行。字节码是介于AST和机器码之间的一种代码，与特定类型的机器代码无关，须要经过解释器转换成机器码才能够执行。

看到这里想必你们都有疑惑，既然字节码也须要转换成机器码才能运行，那一开始为何不直接将AST转换成机器码直接运行呢？转换成机器码直接运行速度确定更快，那为何还要加一个中间过程呢？

其实在V8的5.9版本以前是没有字节码的，而是直接将JS代码编译成机器码并将机器码存储到内存中，这样就占用了大量的内存，而早期的手机内存都不高，过分的占用会致使手机性能大大的降低；并且直接编译成机器码致使编译时间长，启动速度慢；再者直接将JS代码转换成机器码须要针对不一样的CPU架构编写不一样的指令集，复杂度很高。

5.9版本之后引入了字节码，能够解决上述内存占用大、启动时间长、代码复杂度高这几个问题。

接下来咱们来看看Ignition是如何将AST转换成字节码的。

下图是Ignition解释器的工做流程图。AST须要先经过字节码生成器，再通过一系列的优化以后才能生成字节码。

其中的优化包括：

Register Optimizer：主要是避免寄存器没必要要的加载和存储
Peephole Optimizer：寻找字节码中能够复用的部分，并进行合并
Dead-code Elimination：删除无用的代码，减小字节码的大小

将代码转换成字节码后就能够经过解释器执行了。Ignition在执行的过程当中，会监视代码的执行状况并记录执行信息，如函数的执行次数、每次执行函数时所传的参数等。

当同一段代码被执行屡次，就会被标记成热点代码。热点代码会交给TurboFan编译器进行处理。

TurboFan编译器

TurboFan拿到Ignition标记的热点代码后，会先进行优化处理，而后将优化后字节码编译成更高效的机器码存储起来。下次再次执行相同代码时，会直接执行相应的机器码，这样就在很大程度上提高了代码的执行效率。

当一段代码再也不是热点代码后，TurboFan会进行去优化的过程，将优化编译后的机器码还原成字节码，将代码的执行权利交还给Ignition。

如今咱们来看一看具体的执行过程。

以sum += arr[i]为例，因为JS是动态类型的语言，每次的sum和arr[i]都有多是不一样的类型，在执行这段代码时，Ignition每次都会检查sum和arr[i]的数据类型。当发现一样的代码被执行了屡次时，就将其标记为热点代码，交给TurboFan。

TurboFan在执行时，若是每次都判断sum和arr[i]的数据类型是很浪费时间的。所以在优化时，会根据以前的几回执行肯定sum和arr[i]的数据类型，将其编译成机器码。下次再执行时，省去了判断数据类型的过程。

但若是在后续的执行过程当中，arr[i]的数据类型发生了改变，以前生成的机器码就不知足要求了，TurboFan会把以前生成的机器码丢弃，将执行权利再交给Ignition，完成去优化的过程。

热点代码：

优化前：

优化后：

总结

如今咱们来总结一下V8的执行过程：

源代码通过Parser解析器，通过词法分析和语法分析生成AST
AST通过Ignition解释器生成字节码并执行
在执行过程当中，若是发现热点代码，将热点代码交给TurboFan编译器生成机器码并执行
若是热点代码再也不知足要求，进行去优化处理

这种字节码与解释器和编译器结合的技术，就是咱们一般所说的即时编译(JIT)。

本文并无介绍垃圾回收器Orinoco，V8的垃圾回收机制能够单独用一篇文章来详细介绍，咱们下期再见。