详解对象的建立，布局，定位，对象存活判断

时间 2020-08-05

标签详解对象建立布局定位存活判断栏目系统网络繁體版

原文原文链接

咱们在建立普通对象的时候只须要new关键字就解决了，可是在new的背后到底经历了什么呢？咱们建立一个对象的过程究竟是什么样子呢？程序员

1 对象的建立

咱们的Java虚拟机在遇到一条字节码new指令时，首先经历如下的步骤：算法

咱们先不介绍类加载过程，后面若是出了相关博文会在这里给一个超连接（点击跳转）。缓存

在咱们的类检查经过后，也就是到了咱们的虚拟机为咱们的新生对象分配内存。咱们的内存分配方式有两种安全

1.1 指针碰撞

假设Java堆中内存是绝对规整的，全部被使用过的内存都放在一边，空闲的内存被放在另外一边，中间放着一个指针做为分界点的指示器，那所分配的内存就仅仅是把那个指针向空闲方向挪动一段与对象大小相等的举例，这种分配方式称为“指针碰撞”（Bump ThePointer）。通常使用Serial、ParNew等带压缩整理过程的收集器。服务器

1.2 空闲列表

假设Java堆中的内存并非规整的，已被使用的内存和空闲的内存相互交错在一块儿，那就没有办法简单地进行指针碰撞了，虚拟机就必须维护一个列表，记录上哪些内存块是可用的，在分配的时候从列表中找到一块足够大的空间划分给对象实例，并更新列表上的记录，这种分配方式称为“空闲列表”（Free List）。通常使用CMS这种基于清除（Sweep）算法的收集器。并发

注意，由于咱们的虚拟机建立对象是很是频繁的，因此仅仅只是修改一个指针的位置，在并发里也是不安全的。好比给A对象分配内存，指针还没来得及修改，对象B又同时使用了原来的指针来分配内存的状况。咱们针对这种并发安全的问题也提出了两种解决方案：函数

同步处理。对咱们的分配内存空间的操做进行同步处理，采用CAS配上自旋的方式保证更新操做的原子性。
本地线程分配缓冲。把咱们分配内存的动做按照线程划分在不一样的空间之中进行，也就是每一个线程在Java堆中都预先分配一小块内存，称为本地线程分配缓冲区。哪一个线程要分配内存，就在哪一个线程的本地缓冲区分配，只有本地缓冲区用完了，分配新的缓冲区时才须要同步锁定。虚拟机是否使用缓冲区，能够经过参数-XX：+/-UseTLAB参数来设定。

分配完内存就须要将咱们的内存空间都初始化为零值了。而后开始往咱们的对象的对象头里填充一些信息，好比该对象是哪一个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。至此，咱们从虚拟机的角度来看，一个对象已经产生了。可是从Java程序来看，咱们还须要进行构造函数（ ()）,按照按程序员的意愿对对象进行初始化，一个真正可用的对象才算彻底被构造出来。布局

（补充：为了能在多数状况下可以更快的分配内存，设计了一个叫做LinearAllocation Buffer的分配缓冲区，经过空闲列表拿到一大块分配缓冲区以后，在它里面仍然可使用指针碰撞方式来分配。）线程

2 对象的布局

咱们上面介绍了到了在虚拟机中一个对象的建立，咱们接下来介绍的就是对象在堆内存中的存储布局。能够划分为三个部分：对象头（Header）、实例数据（Instance Data）和对齐填充（Padding）。设计

2.1对象头

咱们的对象头主要包括了两类信息。

第一类是用于存储对象自身的运行时数据，如哈希码（HashCode）、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等，简称“Mark Word”。
第二类即是类型指针，即对象指向它的类型元数据的指针，Java虚拟机经过这个指针来肯定该对象是哪一个类的实例。（可是并非全部对象都会保留的，在下面定位的时候会具体谈到！）

关于咱们的Mark Word会根据对象的状态来复用空间，也就是处于什么状态，就会如何分配咱们的比特存储空间。好比处于对象未被同步锁锁定的状态下（无锁态），Mark Word的32个比特存储空间中的25个比特用于存储对象哈希码，4个比特用于存储对象分代年龄，2个比特用于存储锁标志位，1个比特固定为0。下面给上其余状态的空间分布：

2.2实例数据

实例数据是咱们对象真正存储的有效信息，也就是咱们在程序代码里面所定义的各类类型的字段内容，不管是从父类继承下来的，仍是在子类中定义的字段都必须记录起来。具体的存储顺序能够受到虚拟机分配策略参数（-XX：FieldsAllocationStyle参数）和字段在Java源码中定义顺序的影响。

2.3 对齐填充

没有特别的含义，它仅仅起着占位符的做用。因为HotSpot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍，换句话说就是任何对象的大小都必须是8字节的整数倍。对象头部分已经被精心设计成正好是8字节的倍数（1倍或者2倍），所以，若是对象实例数据部分没有对齐的话，就须要经过对齐填充来补全。

3 对象的定位

咱们建立对象是为了后续使用对象，Java程序会经过栈上的reference数据（指向对象的引用）来操做堆上的具体对象。具体的主流对象访问方式主要使用句柄和直接指针两种。

3.1 句柄访问

若是使用句柄访问的话，Java堆中将可能会划分出一块内存来做为句柄池，reference中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与类型数据各自具体的地址信息，结构以下：

使用句柄来访问的最大好处就是reference中存储的是稳定句柄地址，在对象被移动（垃圾收集时移动对象是很是广泛的行为）时只会改变句柄中的实例数据指针，而reference自己不须要被修改。

3.2 直接指针

若是使用直接指针的话，那么咱们的Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关信息，reference中存储的直接就是对象实例数据，若是只是访问对象自己的话，就会了少了一次间接访问的开销，结构以下：

使用直接指针访问的优势是速度快，少了一次指针定位的时间开销。若是对象访问十分频繁的话，那么即是极为可观的执行成本！

4 对象存活判断

咱们的对象在被垃圾回收器回收的时候会进行判断对象是否存活，而后才选择是否回收。而咱们进行判断的两种方式以下：

4.1 引用计数算法

在对象中添加一个引用计数器，若是被引用计数器加 1，引用失效时计数器减 1，若是计数器为 0 则被标记为垃圾。原理简单，效率高，可是在 Java 中不多使用，由于存在对象间循环引用的问题，致使计数器没法清零。

4.2 可达性分析算法

主流语言的内存管理都使用可达性分析判断对象是否存活。基本思路是经过一系列称为 GC Roots 的根对象做为起始节点集，从这些节点开始，根据引用关系向下搜索，搜索过程走过的路径称为引用链，若是某个对象到 GC Roots 没有任何引用链相连，则会被标记为垃圾。可做为 GC Roots 的对象包括虚拟机栈和本地方法栈中引用的对象、类静态属性引用的对象、常量引用的对象。

4.3 谈谈四种引用

在上面对象定位说到了reference是传统的某块内存、对象的引用。可是在JDK1.2以后，咱们的引用被细分红了四种引用，经过强弱依次递减分别是，强引用，软引用，弱引用，虚引用四种。

强引用。最多见的引用，例如 Object obj = new Object() 就属于强引用。只要对象有强引用指向且 GC Roots 可达，在内存回收时即便濒临内存耗尽也不会被回收。
软引用。弱于强引用，描述非必需对象。在系统将发生内存溢出前，会把软引用关联的对象加入回收范围以得到更多内存空间。用来缓存服务器中间计算结果及不须要实时保存的用户行为等。
弱引用。弱于软引用，描述非必需对象。弱引用关联的对象只能生存到下次 YGC （Young GC）前，当垃圾收集器开始工做时不管当前内存是否足够都会回收只被弱引用关联的对象。因为 YGC 具备不肯定性，所以弱引用什么时候被回收也不肯定。
虚引用。最弱的引用，定义完成后没法经过该引用获取对象。惟一目的就是为了能在对象被回收时收到一个系统通知。虚引用必须与引用队列联合使用，垃圾回收时若是出现虚引用，就会在回收对象前把这个虚引用加入引用队列。

5 参考资料

深刻理解Java虚拟机：JVM高级特性（第三版）