JVM系列(三) - JVM对象探秘

时间 2019-12-07

标签 jvm 系列对象探秘栏目 Java 繁體版

原文原文链接

前言

对于 JVM 运行时区域有了必定了解之后，本文将更进一步介绍虚拟机内存中的数据的细节信息。以JVM虚拟机(Hotspot)的内存区域Java堆为例，探讨Java堆是如何建立对象、如何布局对象以及如何访问对象的。java

正文

(一). 对象的建立

说到对象的建立，首先让咱们看看 Java 中提供的几种对象建立方式：编程

Header	解释
使用new关键字	调用了构造函数
使用Class的newInstance方法	调用了构造函数
使用Constructor类的newInstance方法	调用了构造函数
使用clone方法	没有调用构造函数
使用反序列化	没有调用构造函数

下面举例说明五种方式的具体操做方式：后端

Employee.java数组

public class Employee implements Cloneable, Serializable {
 private static final long serialVersionUID = 1L;
 private String name;

 public Employee() {}

 public Employee(String name) {
 this.name = name;
 }

 public String getName() {
 return name;
 }

 public void setName(String name) {
 this.name = name;
 }

 @Override
 public int hashCode() {
 final int prime = 31;
 int result = 1;
 result = prime * result + ((name == null) ? 0 : name.hashCode());
 return result;
 }

 @Override
 public boolean equals(Object obj) {
 if (this == obj)
 return true;
 if (obj == null)
 return false;
 if (getClass() != obj.getClass())
 return false;
 Employee other = (Employee) obj;
 if (name == null) {
 if (other.name != null)
 return false;
 } else if (!name.equals(other.name))
 return false;
 return true;
 }

 @Override
 public String toString() {
 return "Employee [name=" + name + "]";
 }

 @Override
 public Object clone() {
 Object obj = null;
 try {
 obj = super.clone();
 } catch (CloneNotSupportedException e) {
 e.printStackTrace();
 }
 return obj;
 }
}

1. new关键字

这是最多见也是最简单的建立对象的方式了。经过这种方式，咱们能够调用任意的构造函数(无参的和带参数的)。缓存

1	Employee emp1 = new Employee();

1	Employee emp1 = new Employee(name);

2. Class类的newInstance方法

咱们也可使用Class类的newInstance方法建立对象。这个newInstance方法调用无参的构造函数建立对象。多线程

方式一：架构

1	Employee emp2 = (Employee) Class.forName("org.ostenant.jvm.instance.Employee").newInstance();

方式二：框架

1	Employee emp2 = Employee.class.newInstance();

3. Constructor类的newInstance方法

和Class类的newInstance方法很像， java.lang.reflect.Constructor类里也有一个newInstance方法能够建立对象。咱们能够经过这个newInstance方法调用有参数的和私有的构造函数。其中，Constructor能够从对应的Class类中得到。异步

1 2	Constructor<Employee> constructor = Employee.class.getConstructor(); Employee emp3 = constructor.newInstance();

这两种newInstance方法就是你们所说的反射。事实上Class的newInstance方法内部调用Constructor的newInstance方法。jvm

4. Clone方法

不管什么时候咱们调用一个对象的clone方法，JVM都会建立一个新的对象，将前面对象的内容所有拷贝进去。用clone方法建立对象并不会调用任何构造函数。

为了使用clone方法，咱们须要先实现Cloneable接口并实现其定义的clone方法。

1	Employee emp4 = (Employee) emp3.clone();

5. 反序列化

当咱们序列化和反序列化一个对象，JVM会给咱们建立一个单独的对象。在反序列化时，JVM建立对象并不会调用任何构造函数。

为了反序列化一个对象，咱们须要让咱们的类实现Serializable接口。

ByteArrayOutputStream out = new ByteArrayOutputStream();
ObjectOutputStream oos = new ObjectOutputStream(out);
oos.writeObject(emp4);

ByteArrayInputStream in = new ByteArrayInputStream(oos.toByteArray());
ObjectInputStream ois =new ObjectInputStream(in);

Employee emp5 = (Employee) in.readObject();

本文以new关键字为例，讲述JVM堆中对象实例的建立过程以下：

当虚拟机遇到一条new指令时，首先会检查这个指令的参数可否在常量池中定位一个符号引用。而后检查这个符号引用的类字节码对象是否加载、解析和初始化。若是没有，将执行对应的类加载过程。
类加载 完成之后，虚拟机将会为新生对象分配内存区域，对象所需内存空间大小在类加载完成后就已肯定。
内存分配 完成之后，虚拟机将分配到的内存空间都初始化为零值。
虚拟机对对象进行一系列的设置，如所属类的元信息、对象的哈希码、对象GC分带年龄、线程持有的锁 、偏向线程ID 等信息。这些信息存储在对象头 (Object Header)。

上述工做完成之后，从虚拟机的角度来讲，一个新的对象已经产生了。然而，从Java程序的角度来讲，对象建立才刚开始。

(二). 对象的布局

HotSpot虚拟机中，对象在内存中存储的布局能够分为三块区域：对象头（Header）、实例数据（Instance Data）和对齐填充（Padding）。

对象头

在HotSpot虚拟机中，对象头有两部分信息组成：运行时数据 和 类型指针。

1. 运行时数据
用于存储对象自身运行时的数据，如哈希码（hashCode）、GC分带年龄、线程持有的锁、偏向线程ID 等信息。

这部分数据的长度在32位和64位的虚拟机（暂不考虑开启压缩指针的场景）中分别为32个和64个Bit，官方称它为 “Mark Word”。

在32位的HotSpot虚拟机中对象未被锁定的状态下，Mark Word的32个Bit空间中的25Bit用于存储对象哈希码（HashCode），4Bit用于存储对象分代年龄，2Bits用于存储锁标志位，1Bit固定为0。

在其余状态（轻量级锁定、重量级锁定、GC标记、可偏向）下对象的存储内容以下表所示：

存储内容	标志位	状态
对象哈希码、对象分代年龄	01	未锁定
指向锁记录的指针	00	轻量级锁定
指向重量级锁的指针	10	膨胀（重量级锁定）
空，不须要记录信息	11	GC标记
偏向线程ID、偏向时间戳、对象分代年龄	01	可偏向

2. 类型指针

指向实例对象的类元数据的指针，虚拟机经过这个指针来肯定这个对象是哪一个类的实例。

若是对象是一个Java数组，那在对象头中还必须有一块用于记录数组长度的数据。

实例数据

实例数据 部分是对象真正存储的有效信息，不管是从父类继承下来的仍是该类自身的，都须要记录下来，而这部分的存储顺序受虚拟机的分配策略和定义的顺序的影响。

默认分配策略：

long/double -> int/float -> short/char -> byte/boolean -> reference

若是设置了-XX:FieldsAllocationStyle=0（默认是1），那么引用类型数据就会优先分配存储空间：

reference -> long/double -> int/float -> short/char -> byte/boolean

结论：

分配策略老是按照字节大小由大到小的顺序排列，相同字节大小的放在一块儿。

对齐填充

HotSpot虚拟机要求每一个对象的起始地址必须是8字节的整数倍，也就是对象的大小必须是8字节的整数倍。而对象头部分正好是8字节的倍数（32位为1倍，64位为2倍），所以，当对象实例数据部分没有对齐的时候，就须要经过对齐填充来补全。

(三). 对象的访问定位

Java程序须要经过 JVM 栈上的引用访问堆中的具体对象。对象的访问方式取决于 JVM虚拟机的实现。目前主流的访问方式有句柄和 直接指针 两种方式。

指针： 指向对象，表明一个对象在内存中的起始地址。
句柄： 能够理解为指向指针的指针，维护着对象的指针。句柄不直接指向对象，而是指向对象的指针（句柄不发生变化，指向固定内存地址），再由对象的指针指向对象的真实内存地址。

1. 句柄

Java堆中划分出一块内存来做为句柄池，引用中存储对象的句柄地址，而句柄中包含了对象实例数据与对象类型数据各自的具体地址信息，具体构造以下图所示：

优点：引用中存储的是稳定的句柄地址，在对象被移动（垃圾收集时移动对象是很是广泛的行为）时只会改变句柄中的实例数据指针，而引用自己不须要修改。

2. 直接指针

若是使用直接指针访问，引用中存储的直接就是对象地址，那么Java堆对象内部的布局中就必须考虑如何放置访问类型数据的相关信息。

优点：速度更快，节省了一次指针定位的时间开销。因为对象的访问在Java中很是频繁，所以这类开销聚沙成塔后也是很是可观的执行成本。

参考

周志明，深刻理解Java虚拟机：JVM高级特性与最佳实践，机械工业出版社

欢迎关注技术公众号：零壹技术栈

零壹技术栈

本账号将持续分享后端技术干货，包括虚拟机基础，多线程编程，高性能框架，异步、缓存和消息中间件，分布式和微服务，架构学习和进阶等学习资料和文章。