《Java虚拟机原理图解》8.JVM机器指令集

时间 2019-12-17

标签 Java虚拟机原理图解 8.jvm jvm 机器指令栏目 Java 繁體版

原文原文链接

本文连接： http://www.javashuo.com/article/p-njuuyopt-cw.html

0. 前言

Java虚拟机和真实的计算机同样，运行的都是二进制的机器码；而咱们将.java 源代码编译成.class 文件，class文件即是Java虚拟机可以认识的二进制机器码，Java可以识别class文件中的信息和机器指令，进而执行这些机器指令。那么，Java虚拟机是如何运行这些二进制的机器码的呢? 本文将经过一个很是简单的例子，带你感觉一下Java虚拟机运行机器码的过程和其工做的基本原理。css

读完本文，你将会了解到：

一、Java虚拟机对运行时虚拟机栈(JVM Stack) 的组织html

二、方法调用过程是怎样在JVM中表示的java

三、JVM对一个方法执行的基本策略markdown

4. JVM机器指令的格式app

5. 机器指令的执行模式---基于操做数栈的模式
jvm

1. Java虚拟机对运行时虚拟机栈（JVM Stack）的组织

Java虚拟机在运行时会为每个线程在内存中分配了一个虚拟机栈，来表示线程的运行状态和信息，虚拟机栈中的元素称之为栈帧（JVM stack frame）,每个栈帧表示这对一个方法的调用信息。以下所示：ide

上述的描述可能会有点抽象，为了给读者一个直观的感觉，咱们定义一个简单的Java类，而后执行这个运行这个类，逐步分析整个Java虚拟机的运行时信息的组织的。学习

2. 方法调用过程在JVM中是如何表示的

咱们将定义以下带有main方法的简单类org.louis.jvm.codeset.Bootstrap.java ，逐步分析该类在JVM中是如何表示的，方法是如何一步步运行的：ui

    
    
    
    
     
 
      
       
        
       
       
        
        package org.louis.jvm.codeset; 
        
       
 
      
       
        
       
       
        
        /** 
        
       
 
      
       
        
       
       
        
         * JVM 原理简单用例 
        
       
 
      
       
        
       
       
        
         * @author louis 
        
       
 
      
       
        
       
       
        
         * 
        
       
 
      
       
        
       
       
        
         */ 
        
       
 
      
       
        
       
       
        
        public 
        class Bootstrap { 
        
       
 
      
       
        
       
       
        
        
       
 
      
       
        
       
       
        
        public static void main(String[] args) { 
        
       
 
      
       
        
       
       
       
         String name = 
        "Louis"; 
        
       
 
      
       
        
       
       
       
         greeting(name); 
        
       
 
      
       
        
       
       
       
         } 
        
       
 
      
       
        
       
       
        
        
       
 
      
       
        
       
       
        
        public static void greeting(String name) 
        
       
 
      
       
        
       
       
       
         { 
        
       
 
      
       
        
       
       
       
         System.out.println( 
        "Hello,"+name); 
        
       
 
      
       
        
       
       
       
         } 
        
       
 
      
       
        
       
       
        
        
       
 
      
       
        
       
       
       
         }

当咱们将Bootstrap.java 编译成Bootstrap.class 并运行这段程序的时候，在JVM复杂的运行逻辑中，会有如下几步：lua

1. 首先JVM会先将这个Bootstrap.class 信息加载到内存中的方法区(Method Area)中。

Bootstrap.class 中包含了常量池信息，方法的定义以及编译后的方法实现的二进制形式的机器指令，全部的线程共享一个方法区，从中读取方法定义和方法的指令集。

2. 接着，JVM会在Heap堆上为Bootstrap.class 建立一个Class<Bootstrap>实例用来表示Bootstrap.class 的类实例。

3. JVM开始执行main方法，这时会为main方法建立一个栈帧，以表示main方法的整个执行过程（我会在后面章节中详细展开这个过程）；

4. main方法在执行的过程之中，调用了greeting静态方法，则JVM会为greeting方法建立一个栈帧，推到虚拟机栈顶（我会在后面章节中详细展开这个过程）。

5.当greeting方法运行完成后，则greeting方法出栈，main方法继续运行；

JVM方法调用的过程是经过栈帧来实现的，那么，方法的指令是如何运行的呢？弄清楚这个以前，咱们要先了解对于JVM而言，方法的结构是什么样的。

咱们知道，class 文件时 JVM可以识别的二进制文件，其中经过特定的结构描述了每一个方法的定义。

JVM在编译Bootstrap.java 的过程当中，在将源代码编译成二进制机器码的同时，会判断其中的每个方法的三个信息：

1 ). 在运行时会使用到的局部变量的数量（做用是：当JVM为方法建立栈帧的时候，在栈帧中为该方法建立一个局部变量表，来存储方法指令在运算时的局部变量值）

2 ). 其机器指令执行时所须要的最大的操做数栈的大小（当JVM为方法建立栈帧的时候，在栈帧中为方法建立一个操做数栈，保证方法内指令能够完成工做）

3 ). 方法的参数的数量

通过编译以后，咱们能够获得main方法和greeting方法的信息以下：

注：上述编译后的信息所有都存储在Bootstrap.class 文件中，并按照这Class文件格式的形式存储，关于Class文件格式的定义，我在前几篇文章中已经作了很是详尽的介绍，若是您所有阅读了，那么相信您已经能够“读懂” class 文件了。如何读懂class二进制文件中关于method及其相应机器码的组织，请阅读《Java虚拟机原理图解》1.五、 class文件中的方法表集合--method方法在class文件中是怎样组织的。

JVM运行main方法的过程：

1.为main方法建立栈帧：

JVM解析main方法，发现其局部变量的数量为 2，操做数栈的数量为1，则会为main方法建立一个栈帧（VM Stack），并将其加入虚拟机栈中：

2. 完成栈帧初始化：

main栈帧建立完成后，会将栈帧push 到虚拟机栈中，如今有两步重要的事情要作：

a). 计算PC值。PC 是指令计数器，其内部的值决定了JVM虚拟机下一步应该执行哪个机器指令，而机器指令存放在方法区，咱们须要让PC的值指向方法区的main方法上；

初始化 PC = main方法在方法区指令的地址+0；

b). 局部变量的初始化。main方法有个入参(String[] args) ，JVM已经在main所在的栈帧的局部变量表中为其空出来了一个slot ，咱们须要将 args 的引用值初始化到局部点亮表中；

1. 接着JVM开始读取PC指向的机器指令。如上图所示，main方法的指令序列：12 10 4c 2b b8 20 12 b1 ，经过JVM虚拟机指令集规范，能够将这个指令序列解析成如下Java汇编语言:

机器指令汇编语言解释对栈帧的影响

0x12 0x10 ldc #16 将常量池中第16个常量池项引用推到操做数栈栈顶。
常量池第16项是CONSTANT_UTF-8_INFO项，表示”Louis”字符串

0x4c astore_1 操做数栈的栈顶元素出栈，将栈顶元素的值赋给index=1 的局部变量表元素上。

这里等价于：name = “Louis”.

0x2b aload_1 将局部变量表中index=1的元素的值推到操做数栈栈顶

0xb8 0x20 0x12 invokestatic #18 0xb8表示机器指令invokestatic,操做数是0x20 << 8| 0x12 = 18，操做数18表示指向常量池第18项，该项是main方法的符号引用：
org/louis/jvm/codeset/Bootstrap.greeting:(Ljava/lang/String;)V
当JVM执行这条语句的时候，会作如下几件事：
a).方法符号引用校验。会校验这个方法的符号引用，按照这个符号规则在常量池中查找是否有这个方法的定义，若是找到了此方法的定义，则表示解析成功。若是是方法greeting:(Ljava/lang/String;)V没有找到，JVM会抛出错误NoSuchMethodError
b).为新的方法调用建立新的栈帧。而后JVM会为此方法greeting建立一个新的栈帧(VM stack)，并根据greeting中操做数栈的大小和局部变量的数量分别建立相应大小的操做数栈；而后将此栈帧推到虚拟机栈的栈顶。
c).更新PC指令计数器的值。将当前PC程序计数器的值记录到greeting栈帧中，当greeting执行完成后，以便恢复PC值。更新PC的值，使下一条执行的指令地址指向greeting方法的指令开始部分。
这条语句会使当前的main方法执行暂停，使JVM进入对greeting方法的执行当中当greeting方法执行完成后，才会恢复PC程序计数器的值指向当前下一条指令。

0xb1 return 返回

当main方法调用greeting()时， JVM会为greeting方法建立一个栈帧，用以表示对greeting方法的调用，具体栈帧信息以下：

具体的greeting方法的机器码表示的含义以下图所示：

机器指令汇编语言解释 常量池引用

b2 20 1a getstatic #26 获取指定类的静态域，并将其值压入栈顶.
将常量池中的第26个符号引用推到操做数栈中： #26：
// Field java/lang/System.out:Ljava/io/PrintStream;

bb 20 20 new #32 建立一个对象，并将其引用值压入栈顶。
建立一个java/lang/StringBuider实例,将其压入栈顶。 #32:
// class java/lang/StringBuilder

59 dup 复制操做数栈栈顶的值，并插入到栈顶

12 22 ldc #34 从运行时常量池中提取数据推入操做数栈
将“Hello” String引用复制到操做数栈中 #34:
// String Hello,

b7 20 24 invokespecial #36 调用超类构造方法，实例初始化方法，私有方法。
此处调用StringBuilder(String)构造方法，并将结果推到栈顶 #36:
// Method java/lang/StringBuilder."<init>":(Ljava/lang/String;)V

2a aload_0 将第一个局部变量的引用推到栈顶。
当前局部变量表的第一个局部变量引用是：“Louis”，即将Louis推到栈顶

b6 20 26 invokevirtual #38 调用超类构造方法，实例初始化方法，私有方法。
StringBuilder实例的 append(String ) 方法，表示：
"Hello,"+"Louis". // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;

b6 20 2a invokevirtual #42 调用超类构造方法，实例初始化方法，私有方法。
调用StringBuilder实例的toString()方法，结果保留在栈顶。 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;

b6 20 2e invokevirtual #46 调用超类构造方法，实例初始化方法，私有方法。
调用System.out.println(String)方法 // Method java/io/PrintStream.println:(Ljava/lang/String;)V

b1 return 结束返回

3. JVM对一个方法执行的基本策略

通常地，对于java方法的执行，在JVM在其某一特定线程的虚拟机栈(JVM Stack) 中会为方法分配一个局部变量表，一个操做数栈，用以存储方法的运行过程当中的中间值存储。

因为JVM的指令是基于栈的，即大部分的指令的执行，都伴随着操做数的出栈和入栈。因此在学习JVM的机器指令的时候，必定要铭记一点：

每一个机器指令的执行，对操做数栈和局部变量的影响，充分地了解了这个机制，你就能够很是顺畅地读懂class文件中的二进制机器指令了。

以下是栈帧信息的简化图，在分析JVM指令时，脑海中对栈帧有个清晰的认识：

4. 机器指令的格式

所谓的机器指令，就是只有机器才可以认识的二进制代码。一个机器指令分为两部分组成：

注：

a). 如上图所示JVM虚拟机的操做码是由一个字节组成的，也就是说对于JVM虚拟机而言，其指令的数量最多为 2^8,即 256个;

b). 上图中的操做码如:b2,bb,59....等等都是表示某一特定的机器指令，为了方便咱们识别，其分别有相应的助记符：getstatic,new,dup.... 这样方便咱们理解。

5. 机器指令的执行模式---基于操做数栈的模式

对于传统的物理机而言，大部分的机器指令的设计都是寄存器的，物理机内设置若干个寄存器，用以存储机器指令运行过程当中的值，寄存器的数量和支持的指令的个数决定了这个机器的处理能力。

可是Java虚拟机的设计的机制并非这样的，Java虚拟机使用操做数栈来存储机器指令的运算过程当中的值。全部的操做数的操做，都要遵循出栈和入栈的规则，因此在《Java虚拟机规范》中，你会发现有不少机器指令都是关于出栈入栈的操做。

机器指令	汇编语言	解释	对栈帧的影响
0x12 0x10	ldc #16	将常量池中第16个常量池项引用推到操做数栈栈顶。常量池第16项是CONSTANT_UTF-8_INFO项，表示”Louis”字符串
0x4c	astore_1	操做数栈的栈顶元素出栈，将栈顶元素的值赋给index=1 的局部变量表元素上。这里等价于：name = “Louis”.
0x2b	aload_1	将局部变量表中index=1的元素的值推到操做数栈栈顶
0xb8 0x20 0x12	invokestatic #18	0xb8表示机器指令invokestatic,操做数是0x20 << 8\| 0x12 = 18，操做数18表示指向常量池第18项，该项是main方法的符号引用： org/louis/jvm/codeset/Bootstrap.greeting:(Ljava/lang/String;)V 当JVM执行这条语句的时候，会作如下几件事： *a).方法符号引用校验。会校验这个方法的符号引用，按照这个符号规则在常量池中查找是否有这个方法的定义，若是找到了此方法的定义，则表示解析成功。若是是方法`greeting:(Ljava/lang/String;)V`没有找到，JVM会抛出错误`NoSuchMethodError` b).为新的方法调用建立新的栈帧。而后JVM会为此方法greeting建立一个新的栈帧(VM stack)，并根据greeting中操做数栈的大小和局部变量的数量分别建立相应大小的操做数栈；而后将此栈帧推到虚拟机栈的栈顶。 c).更新PC指令计数器的值。*将当前PC程序计数器的值记录到greeting栈帧中，当greeting执行完成后，以便恢复PC值。更新PC的值，使下一条执行的指令地址指向greeting方法的指令开始部分。这条语句会使当前的main方法执行暂停，使JVM进入对greeting方法的执行当中当greeting方法执行完成后，才会恢复PC程序计数器的值指向当前下一条指令。
0xb1	return	返回