JAVA字节码学习

时间 2019-12-09

标签 java 字节学习栏目 Java 繁體版

原文原文链接

学习资料来自java

深刻理解JVM虚拟机segmentfault

http://www.javashuo.com/article/p-msqwsymi-a.html数组

https://blog.csdn.net/luanlouis/article/details/50412126架构

http://www.javashuo.com/article/p-msqxjymb-eh.htmlide

Java虚拟机的指令由一个字节长度的，表明着某种特定操做含义的数字(简称操做码，Opcode)以及跟随其后的零至多个表明此操做所需参数（称做操做数,Operands）来构成的。Java虚拟机采用面向操做数栈而不是寄存器(Android的Dalvik虚拟机则是依靠寄存器)架构的，因此大多数的指令都不包含操做数，只有一个操做码。post

因为Java虚拟机操做码的长度限制在了一个字节（0-255），意味着指令集的操做码总数不可能超过256条。学习

不考虑异常处理的话，Java虚拟机的解释器可使用下面的伪代码当作最基本的执行模型来理解：ui

do{
	自动计算PC寄存器的值+1；
	根据PC寄存器的指示位置，从字节码流中取出操做码；
	if（字节码存在操做数）
	{
		从字节流中取出操做数；
	}
	执行操做码所定义的操做；
}while(字节码长度>0)

字节码与数据类型

在Java虚拟机的指令集中，大多数的指令都包含了其操做所对应的数据类型信息。如iload,fload指令用于从局部变量表中加载int,float型数据到操做数栈中。lua

对于大部分与数据类型相关的字节码指令，它们的操做码助记符中都有特殊的字符来代表专门为哪一种数据类型服务：i表明对int类型的数据操做，l表明long,s表明short,b表明byte,c表明char,f表明float,d表明double,a表明reference。也有一些指令的助记符中没有明确地指明操做类型的字母，如arraylength指令，它没有表明数据类型的特殊字符，但操做数永远只能是一个数组类型的对象。还有另一些指令，如无条件跳转指令goto则是与数据类型无关的。.net

Java虚拟机指令所支持的数据类型以下：

加载和存储指令

加载和存储指令用于将数据在栈帧中的局部变量表和操做数栈之间来回传输，指令内容以下：

将一个局部变量加载到操做栈：iload,iload_<n>,lload,lload_<n>,fload,fload_<n>,dload,dload_<n>,aload,aload_<n>。
将一个数值从操做栈存储到局部变量表：istore,istore_<n>,lsotre,lsotre_<n>,fsotre,fsotre_<n>,dsotre,dsotre_<n>,asotre,asotre_<n>。
加载一个常量到操做数栈：bipush.sipush,ldc,ldc_w,ldc2_w,aconst_null,iconst_ml,iconst_<i>,lconst_<l>,fconst_<f>,dconst_<d>。
扩充局部变量表的访问索引指令：wide。

记录常量指令的区别：

当int取值-1~5时，JVM采用iconst指令将常量压入栈中。

当int取值-128~127时，JVM采用bipush指令将常量压入栈中。

当int取值-32768~32767时，JVM采用sipush指令将常量压入栈中。

当int取值-2147483648~2147483647时，JVM采用ldc指令将常量压入栈中。

存储数据的操做数栈和局部变量表主要就是由加载和存储指令进行操做，除此以外，还有少许指令，如访问对象的字段或者数组元素的指令也会向操做数栈传输数据。

上述的_<n>表述一组数据，如iload_<n>，它表明了 iload_0、iload_一、iload_2 和 iload_3 这几条指令。iload_0的语义与操做数栈数为0时的iload指令语义彻底一致。

运算指令

运算指令用于对两个操做数栈上的值进行某种特定特定运算，并把结果从新存储到操做栈顶。对于运算指令而言能够分红两种：** 对整形数据进行运算的指令与对浮点型数据进行运算的指令。 **不管哪一种运算指令，都是用Java虚拟机的数据类型，因为没有直接支持byte,short,char和boolean的运算指令，对于此类的运算，使用操做int类型的指令代替。运算指令以下：

加法指令：iadd,ladd,fadd,dadd。
减法指令：isub,lsub,fsub,dsub。
乘法指令：imul,lmul,fmul,dmul。
除法指令：idiv,ldiv,fdiv,ddiv。
求余指令：irem,lrem,frem,drem。
取反指令：ineg,lneg,fneg,dneg。
位移指令：ishl,ishr,iushr,lshl,lshr,lushr。
按位或指令：ior,lor。
按位与指令：iand,land。
按位异或指令：ixor,lxor。
局部变量自增指令：iinc。
比较指令：dcmpg,dcmpl,fcmpg,fcmpl,lcmp。

类型转换指令

类型转换指令可让两种不一样的数值类型进行互相转换。Java虚拟机直接支持如下数值类型的宽化类型转换(即小范围到大范围的转换):

int类型转long,float或者double类型
long类型到float,double类型
float类型到double类型

对于窄话类型转换，须要显示使用转换指令完成，指令包括：i2b,i2c,i2s,l2i,f2i,f2l,d2i,d2l,d2f。对于窄化类型转换结果会致使转换结果产生不一样的正负号，精度丢失的状况，好比float转int。

对象建立和访问指令

虽然类实例和数组都是对象，可是Java虚拟机对于这两种的建立和操做使用了不一样的字节码指令，对象建立后，就能够经过对象访问指令获取对象实例或者数组实例中的字段或者数组元素。对应指令以下：

建立类实例的指令：new。
建立数组的指令：newarray,anewarray,multianewarray。
访问类变量和实例变量的指令：getfield,putfield,getstatic,putstatic。
把一个数组元素加载到操做数栈的指令：baload,caload,saload,iaload,laload,faload,daload,aaload。
把一个操做数栈的值存储到数组元素中的指令：bstore,castore,sastore,iastore,fastore,dastore,aastore。
取数组长度的指令：arraylength。
检查类实例类型的指令：instanceof,checkcast。

操做数栈管理指令

Java虚拟机提供了一下直接操做操做数栈的指令，包括：

将操做数栈的栈顶一个或者两个元素出栈：pop,pop2。
复制栈顶一个或者两个数值并将复制值或者双份的复制值从新压入栈顶：dup,dup2,dup_x1,dup2_x1,dup_x2,dup2_x2。
将栈最顶端的两个数值互换：swap。

控制转移指令

控制转移指令就是在有条件或者无条件修改pc寄存器的值，即代码中的if,else,switch等关键字，指令以下：

条件分支：ifeq、ifne、iflt、ifle、ifgt、ifge、ifnull、ifnonnull、if_icmpeq、if_icmpne、if_icmplt、if_icmple、if_icmpgt、if_icmpge、if_acmpeq和if_acmpne。
复合条件分支：tableswitch、lookupswitch。
无条件分支：goto、goto_w、jsr、jsr_w、ret。

方法调用和返回指令

invokevirtual指令：调用对象的实例方法，根据对象的实际类型进行分派(虚方法分派)。
invokeinterface指令：调用接口方法，在运行时搜索一个实现这个接口方法的对象，找出合适的方法进行调用。
invokespecial：调用须要特殊处理的实例方法，包括实例初始化方法，私有方法和父类方法
invokestatic：调用类方法(static)
invokedynamic：用于运行时动态解析出调用点限定符所引用的方法，并执行该方法。

方法返回指令是根据返回值的类型区分的，包括ireturn(返回值是boolean,byte,char,short和 int),lreturn,freturn,drturn和areturn，另一个return供void方法，实例初始化方法，类和接口的类初始化i方法使用。

异常处理指令

在Java程序中显式抛出异常的操做（throw语句）都有athrow 指令来实现，除了用throw 语句显示抛出异常状况外，Java虚拟机规范还规定了许多运行时异常会在其余Java虚拟机指令检测到异常情况时自动抛出。在Java虚拟机中，处理异常不是由字节码指令来实现的，而是采用异常表来完成的。

同步指令

方法级的同步是隐式的，无需经过字节码指令来控制，它实如今方法调用和返回操做中。虚拟机从方法常量池中的方法标结构中的 ACC_SYNCHRONIZED标志区分是不是同步方法。方法调用时，调用指令会检查该标志是否被设置，若设置，执行线程先成功持有管程，而后才能执行方法，最后方法完成释放管程。

若是在同步方法执行期间，方法抛了异常，而且在内部没法处理异常，这个同步方法所持有的管程将会在异常抛到外部时自动释放。

同步一段指令集序列，一般由synchronized块标示，JVM指令集中有monitorenter和monitorexit来支持synchronized语义。结构化锁定是指方法调用期间每个monitor退出都与前面monitor进入相匹配的情形。

总结：

这里只是学习了一下理论的知识，弄明白了对应指令作的对应的事情，经过javap反编译出来的文件中就包含了对应的指令：

public int testInt(java.lang.Object);
   descriptor: (Ljava/lang/Object;)I
   flags: ACC_PUBLIC
   Code:
     stack=2, locals=7, args_size=2
        0: aload_1
        1: dup
        2: astore_2
        3: monitorenter
        4: bipush        11
        6: istore_3
        7: bipush        22
        9: istore        4
       11: aload_1
       12: invokevirtual #12                 // Method java/lang/Object.hashCod
:()I
       15: iconst_2
       16: irem
       17: ifne          27
       20: bipush        33
       22: istore_3
       23: bipush        44
       25: istore        4
       27: iload_3
       28: iload         4
       30: iadd
       31: istore        5
       33: iload         5
       35: aload_2
       36: monitorexit
       37: ireturn
       38: astore_3
       39: iconst_0
       40: aload_2
       41: monitorexit
       42: ireturn
       43: astore        6
       45: aload_2
       46: monitorexit
       47: aload         6
       49: athrow

在以后的学习中，须要应用的对应的分析当中，明白上述的执行过程。