你了解JVM中的 JIT 即时编译及优化技术吗？

时间 2019-11-17

标签了解 jvm jit 即时编译优化技术栏目 Java 繁體版

原文原文链接

JVM Client 模式和 Server模式的区别

经过 java -version 可查看 JVM 所处的模式，并能够经过修改配置文件进行配置，那它们有什么区别呢？java

Server：-Server 模式启动时，速度较慢，可是启动以后，性能更高，适合运行服务器后台程序程序员

Client：-Client 模式启动时，速度较快，启动以后不如 Server，适合用于桌面等有界面的程序数组

热点代码

理解服务器

当虚拟机发现某个方法或代码块的运行特别频繁时，就会把这些代码认定为“热点代码”。架构

热点代码的分类性能

被屡次调用的方法

一个方法被调用得多了，方法体内代码执行的次数天然就多，成为“热点代码”是理所固然的。

被屡次执行的循环体

一个方法只被调用过一次或少许的几回，可是方法体内部存在循环次数较多的循环体，这样循环体的代码也被重复执行屡次，所以这些代码也应该认为是“热点代码”。优化

上面提到的屡次是一个不具体的词语，那究竟是多少次才能成为热点代码呢？操作系统

如何检测热点代码线程

判断一段代码是不是热点代码，是否须要触发即便编译，这样的行为称为热点探测，热点探测并不必定知道方法具体被调用了多少次，目前主要的热点探测断定方式有两种：翻译

基于采样的热点探测：采用这种方法的虚拟机会周期性地检查各个线程的栈顶若是发现某个（或某些）方法常常出如今栈顶，那这个方法就是“热点方法”

优势：实现简单高效，容易获取方法调用关系（将调用堆栈展开便可）

缺点：不精确，容易由于由于受到线程阻塞或别的外界因素的影响而扰乱热点探测

基于计数器的热点探测：采用这种方法的虚拟机会为每一个方法（甚至是代码块）创建计数器，统计方法的执行次数，若是次数超过必定的阈值就认为它是“热点方法”

优势：统计结果精确严谨

缺点：实现麻烦，须要为每一个方法创建并维护计数器，不能直接获取到方法的调用关系

HotSpot使用第二种 - 基于计数器的热点探测方法。

肯定了检测热点代码的方式，如何计算具体的次数呢？

计数器的种类（两种共同协做）

方法调用计数器：这个计数器用于统计方法被调用的次数。默认阈值在 Client 模式下是 1500 次，在 Server 模式下是 10000 次
回边计数器：统计一个方法中循环体代码执行的次数

了解了热点代码和计数器有什么用呢？达到计数器的阈值会触发后文讲解的即时编译，也就是说即时编译是须要达到某种条件才会触发的，先写结论，后文讲解什么是即时编译器。

两个计数器的协做（这里讨论的是方法调用计数器的状况）：当一个方法被调用时，会先检查该方法是否存在被 JIT（后文讲解）编译过的版本，若是存在，则优先使用编译后的本地代码来执行。若是不存在已被编译过的版本，则将此方法的调用计数器加 1，而后判断方法调用计数器与回边计数器之和是否超过方法调用计数器的阈值。若是已经超过阈值，那么将会向即时编译器提交一个该方法的代码编译请求。

当编译工做完成以后，这个方法的调用入口地址就会被系统自动改为新的，下一次调用该方法时就会使用已编译的版本。

什么是字节码、机器码、本地代码？

字节码是指日常所了解的 .class 文件，Java 代码经过 javac 命令编译成字节码

机器码和本地代码都是指机器能够直接识别运行的代码，也就是机器指令

字节码是不能直接运行的，须要通过 JVM 解释或编译成机器码才能运行

此时你要问了，为何 Java 不直接编译成机器码，这样不是更快吗？

1. 机器码是与平台相关的，也就是操做系统相关，不一样操做系统能识别的机器码不一样，若是编译成机器码那岂不是和 C、C++差很少了，不能跨平台，Java 就没有那响亮的口号 “一次编译，处处运行”；

2.之因此不一次性所有编译，是由于有一些代码只运行一次，不必编译，直接解释运行就能够。而那些“热点”代码，反复解释执行确定很慢，JVM 在运行程序的过程当中不断优化，用JIT编译器编译那些热点代码，让他们不用每次都逐句解释执行；

3.还有一方面的缘由是后文讲解的解释器与编译器共存的缘由。

什么是 JIT ？

为了提升热点代码的执行效率，在运行时，虚拟机将会把这些代码编译成与本地平台相关的机器码，并进行各类层次的优化，完成这个任务的编译器称为即时编译器（Just In Time Compiler），简称 JIT 编译器

什么是编译和解释？

编译器：把源程序的每一条语句都编译成机器语言,并保存成二进制文件,这样运行时计算机能够直接以机器语言来运行此程序,速度很快;

解释器：只在执行程序时,才一条一条的解释成机器语言给计算机来执行,因此运行速度是不如编译后的程序运行的快的；

经过javac命令将 Java 程序的源代码编译成 Java 字节码，即咱们常说的 class 文件。这是咱们一般意义上理解的编译。

字节码并非机器语言，要想让机器可以执行，还须要把字节码翻译成机器指令。这个过程是Java 虚拟机作的，这个过程也叫编译。是更深层次的编译。（实际上就是解释，引入 JIT 以后也存在编译）

此时又有疑惑了，Java 不是解释执行的吗？

没错，Java 须要将字节码逐条翻译成对应的机器指令而且执行，这就是传统的 JVM 的解释器的功能，正是因为解释器逐条翻译并执行这个过程的效率低，引入了 JIT 即时编译技术。

必须指出的是，无论是解释执行，仍是编译执行，最终执行的代码单元都是可直接在真实机器上运行的机器码，或称为本地代码

附一张图来理解

编译原理参考：[深刻分析Java的编译原理](www.hollischuang.com/archives/23…)

为什么 HotSpot 虚拟机要使用解释器与编译器并存的架构？

解释器与编译器二者各有优点

解释器：当程序须要迅速启动和执行的时候，解释器能够首先发挥做用，省去编译的时间，当即执行。

编译器：在程序运行后，随着时间的推移，编译器逐渐发挥做用，把愈来愈多的代码编译成本地代码以后，能够获取更高的执行效率。

二者的协做：在程序运行环境中内存资源限制较大时，可使用解释执行节约内存，反之可使用编译执行来提高效率。当经过编译器优化时，发现并无起到优化做用，，能够经过逆优化退回到解释状态继续执行。

即时编译器与 Java 虚拟机的关系

即时编译器并非虚拟机必需的部分，Java 虚拟机规范并无规定 Java 虚拟机内必需要有即时编译器的存在，更没有限定或指导即时编译器应该如何去实现。

可是，即时编译器编译性能的好坏、代码优化程度的高低倒是衡量一款商用虚拟机优秀与否的最关键的指标之一。它也是虚拟机中最核心且最能体现虚拟机技术水平的部分。

即时编译器的分类

Client Compiler - C1编译器
Server Compiler - C2编译器

目前主流的 HotSpot 虚拟机（JDK1.7 及以前版本的虚拟机）默认采用一个解释器和其中一个编译器直接配合的方式工做，程序使用哪一个编译器，取决于虚拟机运行的模式，就是文章开头提到的两种模式。

在 HotSpot 中，解释器和 JIT 即时编译器是同时存在的，他们是 JVM 的两个组件。对于不一样类型的应用程序，用户能够根据自身的特色和需求，灵活选择是基于解释器运行仍是基于 JIT 编译器运行。HotSpot 为用户提供了几种运行模式供选择，可经过参数设定，分别为：解释模式、编译模式、混合模式，HotSpot 默认是混合模式，须要注意的是编译模式并非彻底经过 JIT 进行编译，只是优先采用编译方式执行程序，可是解释器仍然要在编译没法进行的状况下介入执行过程。

分层编译

产生的缘由：因为即时编译器编译本地代码须要占用程序运行时间，要编译出优化程度更高的代码，所花费的时间可能更长；并且要想编译出优化程度更高的代码，解释器可能还要替编译器收集性能监控信息，这对解释执行的速度也有影响。为了在程序启动响应速度与运行效率之间达到最佳平衡，HotSpot 虚拟机启用分层编译的策略

分层编译根据编译器编译、优化的规模与耗时，划分出不一样的编译层次：

第 0 层：程序解释执行，解释器不开启性能监控功能，可触发第 1 层编译。
第 1 层：也称为 C1 编译，将字节码编译为本地代码，进行简单，可靠的优化，若有必要将加入性能监控的逻辑。
第 2 层（或 2 层以上）：也称为 C2 编译，也是将字节码编译为本地代码，可是会启用一些编译耗时较长的优化，甚至会根据性能监控信息进行一些不可靠的激进优化。

实施分层编译后，Client Compiler 和 Server Compiler 将会同时工做，许多代码均可能会被屡次编译看，用 Client Compiler 获取更高的编译速度，用 Server Compiler 获取更好的编译质量，在解释执行的时候也无须再承担收集性能监控信息的任务。

编译优化技术

Java 程序员有一个共识，以编译方式执行本地代码比解释执行方式更快，之因此有这样的共识，除去虚拟机解释执行字节码时额外消耗时间的缘由外，还有一个重要的缘由就是虚拟机设计团队几乎把对代码的全部优化措施都集中在了即时编译器中，所以通常来讲，即时编译器产生的本地代码会比 javac 产生的字节码更优秀。如下是具备表明性的 HotSpot 虚拟机的即时编译器在生成代码时采用的代码优化技术：

语言无关的经典优化技术之一：公共子表达式消除

若是一个表达式 E 已经计算过了，而且从先前的计算到如今 E 中全部变量的值都没有发生变化，那么 E 的此次出现就成为了公共子表达式。对于这种表达式，不必花时间再对它进行计算，只须要直接使用前面计算过的表达式结果代替 E 就能够了。例子：int d = (c*b) * 12 + a + (a+ b * c) -> int d = E * 12 + a + (a+ E)

语言相关的经典优化技术之一：数组范围检查消除

在 Java 语言中访问数组元素的时候系统将会自动进行上下界的范围检查，超出边界会抛出异常。对于虚拟机的执行子系统来讲，每次数组元素的读写都带有一次隐含的条件断定操做，对于拥有大量数组访问的程序代码，这无疑是一种性能负担。Java 在编译期根据数据流分析能够断定范围进而消除上下界检查，节省屡次的条件判断操做。

最重要的优化技术之一：方法内联

简单的理解为把目标方法的代码“复制”到发起调用的方法中，消除一些无用的代码。只是实际的 JVM 中的内联过程很复杂，在此不分析。

最前沿的优化技术之一：逃逸分析

逃逸分析的基本行为就是分析对象动态做用域：当一个对象在方法中杯定义后，它可能被外部方法所引用，例如做为调用参数传递到其余方法中，称为 方法逃逸。甚至可能被外部线程访问到，譬如赋值给类变量或能够在其余线程中访问的实例变量，称为 线程逃逸。

若是能证实一个对象不会逃逸到方法或线程以外，也就是别的方法或线程没法经过任何途径访问到这个对象，则能够为这个变量进行一些高效的优化：

栈上分配：将不会逃逸的局部对象分配到栈上，那对象就会随着方法的结束而自动销毁，减小垃圾收集系统的压力。
同步消除：若是该变量不会发生线程逃逸，也就是没法被其余线程访问，那么对这个变量的读写就不存在竞争，能够将同步措施消除掉（同步是须要付出代价的）
标量替换：标量是指没法在分解的数据类型，好比原始数据类型以及reference类型。而聚合量就是可继续分解的，好比 Java 中的对象。标量替换若是一个对象不会被外部访问，而且对象能够被拆散的话，真正执行时可能不建立这个对象，而是直接建立它的若干个被这个方法使用到的成员变量来代替。这种方式不只可让对象的成员变量在栈上分配和读写，还能够为后后续进一步的优化手段建立条件。

按本身理解整理的，知识点顺序不知是否合适，还请你们指导。

参考来源：

《深刻理解 Java 虚拟机》

www.hollischuang.com/archives/23…