【深刻学习JVM 02】HotSpot虚拟机对象探秘

虚拟机运行时数据区域描述了虚拟机管理的内存划分状况,可是目前咱们对于虚拟机仍是有不少困惑,好比:java

  • 问题1:如何为对象分配内存?
  • 问题2:对象内存模型是怎样的?
  • 问题3:是怎样访问内存中的对象的?
  • 问题4:分配内存的时候若是遇到并发问题,怎么保证分配操做的线程安全性?

为了搞清楚这些问题,咱们先从虚拟机是如何建立对象开始讲起。算法

1、对象建立过程

当虚拟机遇到一条new 指令时,便会进行对象的建立过程。数组

建立对象的过程以下:安全

  • 1.检查常量池中有没有这个类的符号引用,而且检查这个符号引用表明的类有没有被虚拟机加载过。

若是没有被加载过,则执行类加载过程,而后进入下一步; 若是已加载,则进入下一步。数据结构

  • 2.根据方法区中类的信息,在堆区划分一块肯定大小的内存给对象。

(通过类加载后,类的信息被保存在方法区中,一个类的对象所需的内存大小也固定下来。)并发

  • 3.为对象的成员变量赋初始值

内存分配完成以后,须要对分配的内存空间部分区域的内容都初始化为零值。 这一步保证了对象成员变量在java代码中能够不赋初始值。学习

  • 4.设置对象头中的信息线程

    关于对象头是什么, 别急,继续往下看。3d

  • 5.调用<init>方法进行初始化指针

    别再问<init>是什么了,先往下看。

2、问题1解惑:

在堆区分配内存有两种方式。

  • 指针碰撞法

若是堆中内存是规整的,即全部用过的内存都放在一边,空闲的内存放在另外一边,中间用一个指针作分界点的指示器。

分配内存的过程,实际上就是指针向空闲空间那边移动一段与对象大小相等的距离

  • 空闲列表法

java堆中的内存若是不是规整的,就须要使用空闲列表的分配方式。

空闲列表概念:虚拟机维护了一个列表,用于记录哪些内存块是可用的。

在分配的时候,从列表中找到一块知足对象大小的内存空间划分给对象实例,同时会更新列表上的记录

  • 关于两种分配方式的选择

选择哪一种分配方式取决于java堆是否规整。

而java堆是否规整取决于所采用的垃圾收集器是否带有压缩整理的功能。

所以,选择哪一种分配方式最终取决于使用了哪一种垃圾收集器

  • 使用了指针碰撞的垃圾收集器有哪些?

serial、ParNew等基于复制算法或标记整理(Mark Compact)算法的收集器,不会致使内存碎片,所以使用的是指针碰撞。

  • 采用空闲链表垃圾收集器有哪些?

CMS等基于Mark-Sweep(标记清除)算法的收集器,会产生内存碎片,因此使用空闲列表法。

3、问题2解惑

对象在内存中的数据除了实例自己的数据外,还包括对象头对齐填充

3.1 实例数据

实例数据存储的是成员变量的值,包括从父类继承下来的成员变量。

成员变量在内存中的顺序:相同宽度的字段会分配在一块儿,父类定义的变量会出如今子类以前, 默认状况下,子类中较窄的变量可能会被插入到父类变量的间隙中。反正就是不必定按定义的顺序来分配。

3.2 对象头是什么?

对象头的做用是记录对象在运行过程当中所需的数据

好比对象属于哪一个类的实例、所属类的信息在方法区中的位置(类型指针)、对象的哈希码、对象的GC分代年龄等信息。这些信息就保存在对象头中(Object Header)

3.3 对齐填充又是什么?

对齐填充是用于确保对象的内存的总长度为8字节的整数倍。

为何要是确保是8字节的整数倍呢?

由于hotspot要求对象起始地址为8字节的整数倍以便于自动内存管理, 换句话说,对象的总长度要为8字节的整数倍才能保证如此。 而又由于对象头正好是8字节(32位或64位)的整数倍,可是实例数据长度是任意的,所以须要对齐补充来确保整个对象总长度为8字节的整数倍。

4、问题3解惑

java程序须要经过引用来操做堆上的具体数据。 根据引用存放的地址类型的不一样,对象有不一样的访问方式

主要有两种访问方式:

  • 使用句柄访问
  • 使用直接指针访问

4.1 使用句柄访问

堆中会划分一块内存用来作句柄池。引用中存储的就是对象的句柄地址。句柄包含了对象实例数据和对象类型的数据的指针。

经过引用访问对象的时候,会首先根据引用找到对象的句柄,而后根据句柄中对象的地址来访问对象。

4.2 使用直接指针访问

引用中存储的直接是对象的地址,直接经过引用来访问对象。

4.3 两种方式对比

  • 使用句柄

    • 优势:引用中存储的是稳定的句柄地址,发生垃圾收集时可能会移动对象,这时候只须要改变句柄中实例数据的指针指向新对象,而引用的值不须要改。
    • 缺点:须要两次寻址。
  • 使用直接指针

    • 优势:速度快,一次寻址便可。
    • 缺点:须要在对象实例的内存中保存一个指向方法区中该类型数据的指针。不过使用句柄方式句柄中也须要保存类型指针。

直接指针的速度快,hotspot采用就是直接指针的方式

5、问题4解惑

对象分配内存不是线程安全的,好比给对象A分配内存,还没来得及修改指针的指向, 另外一个线程建立对象B也用了原来的指针,这样就会出问题的。

如何解决?

  • 方案1: 对分配内存空间的动做进行同步处理

实际上虚拟机采用CAS配上失败重试的方式保证更新指针操做的原子性。

  • 方案2:把内存分配的动做按照线程划分在不一样的空间中进行

即:每一个线程在java堆中预分配一小块内存, 这一小块内存称做“本地线程分配缓冲"(Thread Local Allocation Buffer, TLAB)

内存分配的过程就能够总结为:不一样线程使用指针碰撞或者空闲列表的方式在各自的TLAB上分配内存。

当线程的TLAB用完须要分配新的TLAB,这时候才须要同步内存分配操做。

虚拟机是否须要使用TLAB,能够经过-XX:+/-UseTLAB参数来决定。

6、遗留问题:<init>方法是个啥?

从上面对象的建立过程,咱们能够了解到,在内存分配完成以后,全部成员变量的值都还只是零值。

对于虚拟机来讲,对象建立已经完毕,可是,对于java程序来讲,对象的初始化才刚开始。

成员变量的初始化工做交由<init>方法的来完成。

编译器收集了成员变量上的赋值操做,实例初始化代码块的赋值操做,以及构造方法中的赋值操做,构成了<init>方法,并执行,对象就获得了初始化。

学习过java基础的人都知道,对象初始化的顺序为: 成员变量上的赋值-->实例初始化块-->构造方法。

<init>方法就解释了为何是这个过程。

7、讲点对象头

对象头的内存模型分三部分:

  • Mark Word
  • 类型指针
  • 记录数组的长度

7.1 Mark Word

存放hashCode、GC分代年龄、锁状态标志、线程持有的锁、偏向线程id、偏向时间戳等。 长度为32位或者64位(32位虚拟机和64位虚拟机)。

mark word是一个非固定的数据结构,在不一样状况下结构会有所变化。

好比:在32位的虚拟机中,若是对象处于未被锁定的状态, mark Word的32位空间将有25位用于存储hashcode, 4位用于存储对象的分代年龄,2位用于存储对象上锁 标志,1位固定为0

这些东西我就不一个个介绍他们是用来干吗的,讲多了反而复杂,大概了解就行,有兴趣的能够百度。

7.2 类型指针

一个指向类元数据的指针,经过这个指针,能够肯定对象是哪一个类的实例。记住,这个指针是在对象头中,但不是在Mark Word中的。

7.3 数组长度

若是对象是一个数组,在对象头中还必须有一块用于记录数组长度的数据。

这一部分仅在对象是数组的时候存在。

点赞是对我最大的鼓励

相关文章
相关标签/搜索