《深刻理解 Java 虚拟机》读书笔记：虚拟机字节码执行引擎

时间 2020-03-16

原文原文链接

正文

执行引擎是 Java 虚拟机最核心的组成部分之一。在不一样的虚拟机实现里，执行引擎在执行 Java 代码时可能会有解释执行（经过解释器执行）和编译执行（经过即时编译器产生本地代码执行）两种选择，也可能二者兼备。但从外观上看，全部 Java 虚拟机的执行引擎都是一致的：输入的是字节码文件，处理过程是字节码解析的等效过程，输出的是执行结果。数据结构

物理机与虚拟机的执行引擎：架构

物理机的执行引擎：直接创建在处理器、硬件、指令集和操做系统层面上。
虚拟机的执行引擎：由本身实现，可自行制定指令集与执行引擎的体系结构，可以执行那些不被硬件直接支持的指令集格式。

1、运行时栈帧结构

栈帧（Stack Frame）是用于支持虚拟机进行方法调用和方法执行的数据结构，它是虚拟机运行时数据区中虚拟机栈的栈元素。栈帧存储了方法的局部变量表、操做数栈、动态链接、方法返回地址和一些额外的附加信息。每个方法从调用开始至执行完成的过程，都对应着一个栈帧在虚拟机里面从入栈到出栈的过程。性能

对于执行引擎来讲，在活动线程中，只有位于栈顶的栈帧才是有效的，称为当前栈帧，与这个栈帧相关联的方法称为当前方法。执行引擎运行的全部字节码指令都只针对当前栈帧进行操做。优化

一、局部变量表

局部变量表（Local Variable Table）是一组变量值存储空间，用于存放方法参数和方法内部定义的局部变量。this

局部变量表的容量以变量槽（Variable Slot，下称 Slot）为最小单位，虚拟机规范中并无明确指明一个 Slot 应占用的内存空间大小。为了尽量节省栈帧空间，局部变量表中的 Slot 是能够重用的。操作系统

虚拟机经过索引定位的方式使用局部变量表，索引值的范围是从 0 开始至局部变量表最大的 Slot 数量。线程

在方法执行时，虚拟机经过局部变量表完成参数值到参数变量列表的传递。若是执行的是实例方法（非 static 方法），那局部变量表中第 0 位索引的 Slot 默认用于传递方法所属对象实例的引用，在方法中可经过关键字“this”访问到这个隐含的参数。其他参数则按照参数表顺序排列，参数表分配完毕后，再根据方法体内部定义的变量顺序和做用域分配其他的 Slot。调试

二、操做数栈

操做数栈（Operand Stack）也称为操做栈，它是一个后入先出的栈。操做数栈的每个元素能够是任意的 Java 数据类型。对象

当一个方法刚开始执行时，这个方法的操做数栈是空的，在方法执行过程当中，会有各类字节码指令往操做数栈中写入和提取内容，这就是出栈/入栈操做。blog

在概念模型中，两个栈帧做为虚拟机栈的元素，是彻底独立的。但在大多数虚拟机的实现里会作一些优化处理，令两个栈帧出现一部分重叠。这样在进行方法调用时就能够共用一部分数据，无须进行额外的参数复制传递。

三、动态链接

每一个栈帧都包含一个指向运行时常量池中，该栈帧所属方法的引用，持有这个引用是为了支持方法调用过程当中的动态链接（Dynamic Linking）。

静态解析：在类加载阶段或第一次使用时，将符号引用转化为直接引用。
动态链接：在每一次运行期间，将符号引用转化为直接引用。

四、方法返回地址

两种退出方法的方式：

正常完成出口： 执行引擎遇到任意一个方法返回的字节码指令，此时可能会有返回值传递给上层的方法调用者。
异常完成出口： 方法执行过程当中遇到了异常，而且这个异常没有在方法体内获得处理，这种退出方式不会有返回值。。

不管何种退出方式，方法退出后都须要返回到方法被调用的位置，程序才能继续执行，方法返回时可能须要在栈帧中保存一些信息，用来帮助恢复它的上层方法的执行状态。

通常来讲，方法正常退出时，调用者的 PC 计数器的值能够做为返回地址，栈帧中极可能会保存这个计数器值。而方法异常退出时，返回地址要经过异常处理器表来肯定，栈帧中通常不会保存这部分信息。

方法退出的过程实际上等同于把当前栈帧出栈，所以退出时可能执行的操做有：恢复上层方法的局部变量表和操做数栈，把返回值（有的话）压入调用者栈帧的操做数栈中，调整 PC 计数器的值以指向方法调用指令后面的一条指令等。

五、附加信息

虚拟机规范容许具体的虚拟机实现增长一些规范里没有描述的信息到栈帧中，例如与调试相关的信息。

2、方法调用

方法调用并不等于方法执行，方法调用阶段惟一的任务就是肯定被调用方法的版本（即调用哪个方法），暂时还不涉及方法内部的具体运行过程。

一切方法调用在 Class 文件里存储的只是符号引用，而不是直接引用，只有在类加载期间，甚至是运行期间才能肯定目标方法的直接引用。

方法调用字节码指令：

invokestatic：调用静态方法。
invokespecial：调用实例构造器 init() 方法、私有方法、父类方法。
invokevirtual：调用全部虚方法。
invokeinterface：调用接口方法，会在运行时再肯定一个实现此接口的对象。
invokedynamic：先在运行时动态解析出调用点限定符所引用的方法，而后再执行该方法。

一、解析

在类加载的解析阶段，将方法的符号引用转化为直接引用，这类方法调用称为解析。这种解析能成立的前提是：方法在程序执行以前有一个可肯定的调用版本，而且这个方法的调用版本在运行期不可改变，即“编译期可知，运行期不可变”。

只要能被 invokestatic 和 invokespecial 指令调用的方法，均可以在解析阶段肯定惟一的调用版本，所以都能在类加载阶段被解析。这些方法称为非虚方法，与之相反，其余方法称为虚方法。

final 方法虽然是使用 invokevirtual 指令调用的，但因为它没法被覆盖，没有其余版本，因此无须对方法接收者进行多态选择。所以，fanal 方法也属于非虚方法。

二、分派

（1）静态分派

依赖静态类型（又称外观类型）来定位方法执行版本的分派动做，称为静态分派。静态分派的典型应用是方法重载。

静态类型是编译期可知的。

静态分派发生在编译阶段，所以肯定静态分派的动做不是由虚拟机来执行的。

（2）动态分派

在运行期根据实际类型肯定方法执行版本的分派过程，称为动态分派。动态分派的典型应用是方法重写。

实际类型是在运行期才可肯定。

动态分派是很是频繁的动做，并且运行时须要在类的方法元数据中搜索合适的目标方法。基于性能的考虑，大部分的虚拟机实现都不会真正地进行如此频繁的搜索。最经常使用的“稳定优化”手段是为类在方法区中创建一个虚方法表，使用虚方法表索引来代替元数据查找以提升性能。

虚方法表中存放着各个方法的实际入口地址。

（3）单分派与多分派

根据分派基于多少种宗量，能够将分派划分为单分派和多分派。单分派是根据一个宗量对目标方法进行选择，多分派则是根据多于一个宗量对目标方法进行选择。

方法的接收者与方法的参数统称为方法的宗量。

静态分派是根据方法接收者的静态类型和方法参数来选择目标方法的，所以静态分派属于多分派类型。

动态分派只根据方法接收者的实例类型来选择目标方法，所以动态分派属于单分派类型。

3、基于栈的字节码解释执行引擎

一、编译过程

现在，基于物理机、虚拟机的语言，大多都会遵循基于现代经典编译原理的思路，在执行前先对程序源码进行词法分析和语法分析处理，把源码转化为抽象语法树。

对于一门具体语言的实现来讲，词法分析、语法分析以及后面的优化器和目标代码生成器均可以选择独立于执行引擎，造成一个完整意义的编译器去实现，这类表明是 C/C++ 语言。也能够选择把其中的一部分（如生成抽象语法树以前的步骤）实现为一个半独立的编译器，这类表明是 Java 语言。又或者把这些步骤和执行引擎所有集中封装在一个封闭的黑匣子之中，如大多数的 JavaScript 执行器。

Java 语言中，Javac 编译器完成了程序代码通过词法分析、语法分析到抽象语法树，再遍历语法树生成线性的字节码指令流的过程。由于这一部分动做是在 Java 虚拟机以外进行的，而解释器在虚拟机内部，因此 Java 程序的编译就是半独立的实现。

二、解释执行

Java 语言常常被定位为“解释执行”的语言，在 Java 初生的 JDK1.0 时代，这种定义还算准确，但当主流的虚拟机中包含了即时编译器后，Class 文件中的代码到底会被解释执行仍是编译执行，就成了只有虚拟机本身才能准确判断的事情。

三、基于栈的指令集与基于寄存器的指令集

Java 编译器输出的指令流，基本上是一种基于栈的指令集架构，指令流中的指令大部分是零地址指令，它们依赖操做数栈进行工做。与之相对的另一套经常使用的指令集架构是基于寄存器的指令集，最典型的就是 x86 的二地址指令集，这些指令依赖寄存器进行工做。

基于栈的指令集：可移植，但执行速度相对较慢。
基于寄存器的指令集：执行速度快，但因为寄存器由硬件直接提供，程序不可避免要受到硬件的约束。