对于 JVM
运行时区域有了必定了解之后,本文将更进一步介绍虚拟机内存中的数据的细节信息。以JVM
虚拟机(Hotspot
)的内存区域Java
堆为例,探讨Java
堆是如何建立对象、如何布局对象以及如何访问对象的。java
说到对象的建立,首先让咱们看看 Java
中提供的几种对象建立方式:编程
Header | 解释 |
---|---|
使用new关键字 | 调用了构造函数 |
使用Class的newInstance方法 | 调用了构造函数 |
使用Constructor类的newInstance方法 | 调用了构造函数 |
使用clone方法 | 没有调用构造函数 |
使用反序列化 | 没有调用构造函数 |
下面举例说明五种方式的具体操做方式:后端
Employee.java数组
1 |
public class Employee implements Cloneable, Serializable { |
这是最多见也是最简单的建立对象的方式了。经过这种方式,咱们能够调用任意的构造函数(无参的和带参数的)。缓存
1 |
Employee emp1 = new Employee(); |
1 |
Employee emp1 = new Employee(name); |
咱们也可使用Class
类的newInstance
方法建立对象。这个newInstance
方法调用无参的构造函数建立对象。多线程
方式一:架构
1 |
Employee emp2 = (Employee) Class.forName("org.ostenant.jvm.instance.Employee").newInstance(); |
方式二:框架
1 |
Employee emp2 = Employee.class.newInstance(); |
和Class
类的newInstance
方法很像, java.lang.reflect.Constructor
类里也有一个newInstance
方法能够建立对象。咱们能够经过这个newInstance
方法调用有参数的和私有的构造函数。其中,Constructor
能够从对应的Class
类中得到。异步
1 |
Constructor<Employee> constructor = Employee.class.getConstructor(); |
这两种newInstance方法就是你们所说的反射。事实上Class的newInstance方法内部调用Constructor的newInstance方法。jvm
不管什么时候咱们调用一个对象的clone
方法,JVM
都会建立一个新的对象,将前面对象的内容所有拷贝进去。用clone
方法建立对象并不会调用任何构造函数。
为了使用clone
方法,咱们须要先实现Cloneable
接口并实现其定义的clone
方法。
1 |
Employee emp4 = (Employee) emp3.clone(); |
当咱们序列化和反序列化一个对象,JVM
会给咱们建立一个单独的对象。在反序列化时,JVM
建立对象并不会调用任何构造函数。
为了反序列化一个对象,咱们须要让咱们的类实现Serializable
接口。
1 |
ByteArrayOutputStream out = new ByteArrayOutputStream(); |
本文以new
关键字为例,讲述JVM
堆中对象实例的建立过程以下:
当虚拟机遇到一条new
指令时,首先会检查这个指令的参数可否在常量池中定位一个符号引用。而后检查这个符号引用的类字节码对象是否加载、解析和初始化。若是没有,将执行对应的类加载过程。
类加载 完成之后,虚拟机将会为新生对象分配内存区域,对象所需内存空间大小在类加载完成后就已肯定。
内存分配 完成之后,虚拟机将分配到的内存空间都初始化为零值。
虚拟机对对象进行一系列的设置,如所属类的元信息、对象的哈希码、对象GC分带年龄、线程持有的锁 、偏向线程ID 等信息。这些信息存储在对象头 (Object Header
)。
上述工做完成之后,从虚拟机的角度来讲,一个新的对象已经产生了。然而,从Java
程序的角度来讲,对象建立才刚开始。
HotSpot
虚拟机中,对象在内存中存储的布局能够分为三块区域:对象头(Header
)、实例数据(Instance Data
)和对齐填充(Padding
)。
在HotSpot
虚拟机中,对象头有两部分信息组成:运行时数据 和 类型指针。
1. 运行时数据
用于存储对象自身运行时的数据,如哈希码(hashCode)、GC分带年龄、线程持有的锁、偏向线程ID 等信息。
这部分数据的长度在32
位和64
位的虚拟机(暂不考虑开启压缩指针的场景)中分别为32
个和64
个Bit
,官方称它为 “Mark Word”
。
在32位的HotSpot虚拟机中对象未被锁定的状态下,Mark Word的32个Bit空间中的25Bit用于存储对象哈希码(HashCode),4Bit用于存储对象分代年龄,2Bits用于存储锁标志位,1Bit固定为0。
在其余状态(轻量级锁定、重量级锁定、GC标记、可偏向)下对象的存储内容以下表所示:
存储内容 | 标志位 | 状态 |
---|---|---|
对象哈希码、对象分代年龄 | 01 | 未锁定 |
指向锁记录的指针 | 00 | 轻量级锁定 |
指向重量级锁的指针 | 10 | 膨胀(重量级锁定) |
空,不须要记录信息 | 11 | GC标记 |
偏向线程ID、偏向时间戳、对象分代年龄 | 01 | 可偏向 |
2. 类型指针
指向实例对象的类元数据的指针,虚拟机经过这个指针来肯定这个对象是哪一个类的实例。
若是对象是一个Java
数组,那在对象头中还必须有一块用于记录数组长度的数据。
实例数据 部分是对象真正存储的有效信息,不管是从父类继承下来的仍是该类自身的,都须要记录下来,而这部分的存储顺序受虚拟机的分配策略和定义的顺序的影响。
默认分配策略:
long/double -> int/float -> short/char -> byte/boolean -> reference
若是设置了-XX:FieldsAllocationStyle=0
(默认是1
),那么引用类型数据就会优先分配存储空间:
reference -> long/double -> int/float -> short/char -> byte/boolean
结论:
分配策略老是按照字节大小由大到小的顺序排列,相同字节大小的放在一块儿。
HotSpot
虚拟机要求每一个对象的起始地址必须是8
字节的整数倍,也就是对象的大小必须是8
字节的整数倍。而对象头部分正好是8
字节的倍数(32
位为1
倍,64
位为2
倍),所以,当对象实例数据部分没有对齐的时候,就须要经过对齐填充来补全。
Java
程序须要经过 JVM
栈上的引用访问堆中的具体对象。对象的访问方式取决于 JVM
虚拟机的实现。目前主流的访问方式有 句柄 和 直接指针 两种方式。
指针: 指向对象,表明一个对象在内存中的起始地址。
句柄: 能够理解为指向指针的指针,维护着对象的指针。句柄不直接指向对象,而是指向对象的指针(句柄不发生变化,指向固定内存地址),再由对象的指针指向对象的真实内存地址。
Java
堆中划分出一块内存来做为句柄池,引用中存储对象的句柄地址,而句柄中包含了对象实例数据与对象类型数据各自的具体地址信息,具体构造以下图所示:
优点:引用中存储的是稳定的句柄地址,在对象被移动(垃圾收集时移动对象是很是广泛的行为)时只会改变句柄中的实例数据指针,而引用自己不须要修改。
若是使用直接指针访问,引用 中存储的直接就是对象地址,那么Java
堆对象内部的布局中就必须考虑如何放置访问类型数据的相关信息。
优点:速度更快,节省了一次指针定位的时间开销。因为对象的访问在Java
中很是频繁,所以这类开销聚沙成塔后也是很是可观的执行成本。
周志明,深刻理解Java虚拟机:JVM高级特性与最佳实践,机械工业出版社
欢迎关注技术公众号: 零壹技术栈
零壹技术栈
本账号将持续分享后端技术干货,包括虚拟机基础,多线程编程,高性能框架,异步、缓存和消息中间件,分布式和微服务,架构学习和进阶等学习资料和文章。