java编译过程（字节码编译和即时编译）

时间 2019-11-18

标签 java 编译过程字节即时栏目 Java 繁體版

原文原文链接

简介：java

编译包括两种状况：
1，源码编译成字节码
2，字节码编译成本地机器码（符合本地系统专属的指令）
解释执行也包括两种状况：
1，源码解释执行
2，字节码解释执行

解释和编译执行的区别是：是否产生中间本地机器码。

一，编译过程：

大部分的程序代码从开始编译到最终转化成物理机的目标代码或虚拟机能执行的指令集以前，都会按照以下图所示的各个步骤进行：后端

其中绿色的模块能够选择性实现。缓存

上图中间的那条分支是解释执行的过程（即一条字节码一条字节码地解释执行，如JavaScript），
而下面的那条分支就是传统编译原理中从源代码到目标机器代码的生成过程。

二，现代经典编译原理的思路：

在执行前先对程序源码进行词法解析和语法解析处理，把源码转化为抽象语法树。

对于一门具体语言的实现来讲:函数

词法和语法分析乃至后面的优化器和目标代码生成器均可以选择独立于执行引擎，造成一个完整意义的编译器去实现，这类表明是C/C++语言。
也能够把抽象语法树或指令流以前的步骤实现一个半独立的编译器，这类表明是Java语言。
又或者能够把这些步骤和执行引擎所有集中在一块儿实现，如大多数的JavaScript执行器。

三，Javac编译

在Java中提到“编译”，天然很容易想到Javac编译器将*.java文件编译成为*.class文件的过程，优化

1，这里的Javac编译器称为前端编译器，其余的前端编译器还有诸如Eclipse JDT中的增量式编译器ECJ等。

2，相对应的还有后端编译器，它在程序运行期间将字节码转变成机器码（如今的Java程序在运行时基本都是解释执行加编译执行），
   如HotSpot虚拟机自带的JIT（Just In Time Compiler）编译器（分Client端和Server端）。

3，有时候还有静态提早编译器（AOT，Ahead Of Time Compiler）直接把*.java文件编译成本地机器代码，如GCJ、Excelsior JET等，这类编译器咱们应该比较少遇到。

Javac编译（前端编译）的过程：

1，词法、语法分析spa

词法分析是将源代码的字符流转变为标记（Token）集合。.net

单个字符是程序编写过程当中的的最小元素，而标记则是编译过程的最小元素，关键字、变量名、字面量、运算符等均可以成为标记，
好比整型标志int由三个字符构成，可是它只是一个标记，不可拆分。

语法分析是根据Token序列来构造抽象语法树的过程。线程

抽象语法树是一种用来描述程序代码语法结构的树形表示方式，语法树的每个节点都表明着程序代码中的一个语法结构，如类型、修饰符、运算符等。

通过这个步骤后，编译器就基本不会再对源码文件进行操做了，后续的操做都创建在抽象语法树之上。code

2，填充符号表

完成了语法分析和词法分析以后，下一步就是填充符号表的过程。

符号表是由一组符号地址和符号信息构成的表格。

符号表中所登记的信息在编译的不一样阶段都要用到，在语义分析（后面的步骤）中，符号表所登记的内容将用于语义检查和产生中间代码，
在目标代码生成阶段，对符号名进行地址分配时，符号表是地址分配的依据。

好比：默认构造器的添加。

3，语义分析

语法树能表示一个结构正确的源程序的抽象，但没法保证源程序是符合逻辑的。

而语义分析的主要任务是：

对结构上正确的源程序进行上下文有关性的审查。

语义分析过程分为标注检查和数据及控制流分析两个步骤：

1，标注检查的内容包括诸如：变量使用前是否已被声明、变量和赋值之间的数据类型是否匹配等。

2，数据及控制流分析是对程序上下文逻辑更进一步的验证，
   检查出诸如:程序局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否全部的受查异常都被正确处理了等问题。

4，字节码生成

字节码生成是Javac编译过程的最后一个阶段。

字节码生成阶段不只仅是把前面各个步骤所生成的信息转化成字节码写到磁盘中，编译器还进行了少许的代码添加和转换工做。

实例构造器<init>（）方法和类构造器<clinit>（）方法就是在这个阶段添加到语法树之中的
这里的实例构造器并非指默认的构造函数，而是指咱们本身重载的构造函数，

若是用户代码中没有提供任何构造函数，那编译器会自动添加一个没有参数、访问权限与当前类一致的默认构造函数，这个工做在填充符号表阶段就已经完成了。

四，JIT编译

1,即时编译的产生：

Java程序最初是仅仅经过解释器解释执行的，即对字节码逐条解释执行，这种方式的执行速度相对会比较慢，

尤为当某个方法或代码块运行的特别频繁时，这种方式的执行效率就显得很低。

因而后来在虚拟机中引入了JIT编译器（即时编译器），
当虚拟机发现某个方法或代码块运行特别频繁时，就会把这些代码认定为“Hot Spot Code”（热点代码），
为了提升热点代码的执行效率，在运行时，虚拟机将会把这些代码编译成与本地平台相关的机器码，并进行各层次的优化，完成这项任务的正是JIT编译器。

PS：区别是：即时编译生成机器相关的中间码，可重复执行缓存效率高。解释执行直接执行字节码，重复执行须要重复解释。

如今主流的商用虚拟机（如Sun HotSpot、IBM J9）中几乎都同时包含解释器和编译器

（三大商用虚拟机之一的JRockit是个例外，它内部没有解释器，所以会有启动相应时间长，但它主要是面向服务端的应用，这类应用通常不会重点关注启动时间）。

两者各有优点：

当程序须要迅速启动和执行时，解释器能够首先发挥做用，省去编译的时间，当即执行；
当程序运行后，随着时间的推移，编译器逐渐会失去做用，把愈来愈多的代码编译成本地代码后，能够获取更高的执行效率。

解释执行能够节约内存，而编译执行能够提高效率。

目前主流的HotSpot虚拟机中默认是采用解释器与其中一个编译器直接配合的方式工做。

2，运行过程当中会被即时编译器编译的“热点代码”有两类：

被屡次调用的方法。
被屡次调用的循环体。

两种状况，编译器都是以整个方法做为编译对象，这种编译也是虚拟机中标准的编译方式。

一段代码或方法是否是热点代码，是否是须要触发即时编译，须要进行Hot Spot Detection（热点探测）。

3，目前主要的热点断定方式有如下两种：

3,1，基于采样的热点探测：

虚拟机会周期性地检查各个线程的栈顶，若是发现某些方法常常出如今栈顶，那这段方法代码就是“热点代码”。

好处是：实现简单高效，还能够很容易地获取方法调用关系，
缺点是：很难精确地确认一个方法的热度，容易由于受到线程阻塞或别的外界因素的影响而扰乱热点探测。

3,2，基于计数器的热点探测：

虚拟机会为每一个方法，甚至是代码块创建计数器，统计方法的执行次数，
若是执行次数超过必定的阀值，就认为它是“热点方法”。

这种统计方法实现复杂一些，须要为每一个方法创建并维护计数器，并且不能直接获取到方法的调用关系，可是它的统计结果相对更加精确严谨。

4，在HotSpot虚拟机中使用的是第二种——基于计数器的热点探测方法的两个计数器：

方法调用计数器和回边计数器。

4,1，方法调用计数器：

用来统计方法调用的次数，在默认设置下，方法调用计数器统计的并非方法被调用的绝对次数，而是一个相对的执行频率，即一段时间内方法被调用的次数。

4,2，回边计数器：

用于统计一个方法中循环体代码执行的次数.
（准确地说，应该是回边的次数，由于并不是全部的循环都是回边），
在字节码中遇到控制流向后跳转的指令就称为“回边”。

在肯定虚拟机运行参数的前提下，这两个计数器都有一个肯定的阀值，当计数器的值超过了阀值，就会触发JIT编译。

5,即时编译和解释执行的执行顺序：

触发了JIT编译后，在默认设置下，执行引擎并不会同步等待编译请求完成，
而是继续进入解释器按照解释方式执行字节码，直到提交的请求被编译器编译完成为止（编译工做在后台线程中进行）。
当编译工做完成后，下一次调用该方法或代码时，就会使用已编译的版本。

6,方法调用计数器触发即时编译的流程：

方法计数器触发即时编译的过程与回边计数器触发即时编译的过程相似