JVM是每一个Java开发天天都会接触到的东西, 其相关知识也应该是每一个人都要深刻了解的. 但接触了不少人发现: 或了解片面或知识体系陈旧. 所以最近抽时间研读了几本评价较高的JVM入门书籍, 算是总结于此. 本系列博客的主体来自 深刻理解Java虚拟机(第二版) 和 实战Java虚拟机 两部书, 部份内容参考 HotSpot实战 和 深刻理解计算机系统 以及网上大量的文章. 若文内有引文未注明出处的, 还请联系做者修改.html
JVM 虚拟机架构(图片来源: 浅析Java虚拟机结构与机制)java
JVM会将Java进程所管理的内存划分为若干不一样的数据区域. 这些区域有各自的用途、建立/销毁时间:程序员
(图片来源: JAVA的内存模型及结构)算法
线程私有数据区域生命周期与线程相同, 依赖用户线程的启动/结束而建立/销毁(在Hotspot VM内, 每一个线程都与操做系统的本地线程直接映射, 所以这部份内存区域的存/否跟随本地线程的生/死).数组
一块较小的内存空间, 做用是当前线程所执行字节码的行号指示器(相似于传统CPU模型中的PC), PC在每次指令执行后自增, 维护下一个将要执行指令的地址. 在JVM模型中, 字节码解释器就是经过改变PC值来选取下一条须要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都须要依赖PC完成(仅限于Java方法, Native方法该计数器值为undefined
).
不一样于OS以进程为单位调度, JVM中的并发是经过线程切换并分配时间片执行来实现的. 在任何一个时刻, 一个处理器内核只会执行一条线程中的指令. 所以, 为了线程切换后能恢复到正确的执行位置, 每条线程都须要有一个独立的程序计数器, 这类内存被称为“线程私有”内存.架构
虚拟机栈描述的是Java方法执行的内存模型: 每一个方法被执行时会建立一个栈帧(Stack Frame)用于存储局部变量表、操做数栈、动态连接、方法出口等信息. 每一个方法被调用至返回的过程, 就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程(VM提供了-Xss
来指定线程的最大栈空间, 该参数也直接决定了函数调用的最大深度).并发
long
和double
占用2个局部变量空间(Slot), 其他只占用1个. 以下Java方法代码可使用javap命令或javassist等字节码工具读到:public String test(int a, long b, float c, double d, Date date, List<String> list) { StringBuilder sb = new StringBuilder().append(a).append(b).append(c).append(d).append(date); for (String str : list) { sb.append(str); } return sb.toString(); }
注: javap/javassist读到的实际上是静态数据, 而局部变量表内存储的倒是运行时动态加载的动态数据, 但由于局部变量表所需的内存空间在编译期间便可完成分配, 当进入一个方法时, 这个方法须要在帧中分配多大的局部变量空间是彻底肯定的,在方法运行期间大小不会改变, 所以能够在概念上认定这两部份内容存储的数据格式相同.app
与Java Stack做用相似, 区别是Java Stack为执行Java方法服务, 而本地方法栈则为Native方法服务, 若是一个VM实现使用C-linkage模型来支持Native调用, 那么该栈将会是一个C栈(详见: JVM学习笔记-本地方法栈(Native Method Stacks)), 但HotSpot VM直接就把本地方法栈和虚拟机栈合二为一.函数
随虚拟机的启动/关闭而建立/销毁.工具
几乎全部对象实例和数组都要在堆上分配(栈上分配、标量替换除外), 所以是VM管理的最大一块内存, 也是垃圾收集器的主要活动区域. 因为现代VM采用分代收集算法, 所以Java堆从GC的角度还能够细分为: 新生代(Eden区、From Survivor区和To Survivor区)和老年代; 而从内存分配的角度来看, 线程共享的Java堆还还能够划分出多个线程私有的分配缓冲区(TLAB). 而进一步划分的目的是为了更好地回收内存和更快地分配内存.
即咱们常说的永久代(Permanent Generation), 用于存储被JVM加载的类信息、常量、静态变量、即时编译器编译后的代码等数据. HotSpot VM把GC分代收集扩展至方法区, 即使用Java堆的永久代来实现方法区, 这样HotSpot的垃圾收集器就能够像管理Java堆同样管理这部份内存, 而没必要为方法区开发专门的内存管理器(永久带的内存回收的主要目标是针对常量池的回收和类型的卸载, 所以收益通常很小)
不过在1.7的HotSpot已经将本来放在永久代的字符串常量池移出:
而在1.8中, 永久区已经被完全移除, 取而代之的是元数据区Metaspace(这一点在查看GC日志和使用jstat -gcutil查看GC状况时能够观察到),与永久代不一样, 若是不指定Metaspace大小, 若是方法区持续增加, VM会默认耗尽全部系统内存.
test
方法中读到的signature
信息). 但Java语言并不要求常量必定只能在编译期产生, 即并不是预置入Class文件中常量池的内容才能进入方法区运行时常量池, 运行期间也可能将新的常量放入池中, 如String
的intern()
方法.直接内存并非JVM运行时数据区的一部分, 但也会被频繁的使用: 在JDK 1.4引入的NIO提供了基于Channel与Buffer的IO方式, 它可使用Native函数库直接分配堆外内存, 而后使用DirectByteBuffer
对象做为这块内存的引用进行操做(详见: Java I/O 扩展), 这样就避免了在Java堆和Native堆中来回复制数据, 所以在一些场景中能够显著提升性能.
显然, 本机直接内存的分配不会受到Java堆大小的限制(即不会遵照-Xms、-Xmx等设置), 但既然是内存, 则确定仍是会受到本机总内存大小及处理器寻址空间的限制, 所以动态扩展时也会出现OutOfMemoryError
异常.
new
一个Java Object(包括数组和Class对象), 在JVM会发生以下步骤:
new
指令: 首先去检查该指令的参数是否能在常量池中定位到一个类的符号引用, 并检查这个符号引用表明的类是否已被加载、解析和初始化过. 若是没有, 必须先执行相应的类加载过程.-XX:+/-UseTLAB
参数设定).<init>
方法还没有执行, 全部字段还都为零). 因此new
指令以后通常会(由字节码中是否跟随有invokespecial
指令所决定-Interface通常不会有, 而Class通常会有)接着执行<init>
方法, 把对象按照程序员的意愿进行初始化, 这样一个真正可用的对象才算彻底产生出来.HotSpot VM内, 对象在内存中的存储布局能够分为三块区域:对象头、实例数据和对齐填充:
注意: 并不是全部VM实现都必须在对象数据上保留类型指针, 也就是说查找对象的元数据并不是必定要通过对象自己(详见下面句柄定位对象方式).
状态 | 标志位 | 存储内容 |
---|---|---|
未锁定 | 01 | 对象哈希码、对象分代年龄 |
轻量级锁定 | 00 | 指向锁记录的指针 |
膨胀(重量级锁定) | 10 | 执行重量级锁定的指针 |
GC标记 | 11 | 空(不须要记录信息) |
可偏向 | 01 | 偏向线程ID、偏向时间戳、对象分代年龄 |
longs
/doubles
、ints
、shorts
/chars
、bytes
/booleans
、oops
(Ordinary Object Pointers), 相同宽度的字段老是被分配到一块儿, 在知足这个前提条件下, 在父类中定义的变量会出如今子类以前. 若是CompactFields
参数值为true
(默认), 那子类中较窄的变量也可能会插入到父类变量的空隙中.创建对象是为了使用对象, Java程序须要经过栈上的reference来操做堆上的具体对象. 主流的有句柄和直接指针两种方式去定位和访问堆上的对象:
句柄: Java堆中将会划分出一块内存来做为句柄池, reference中存储对象的句柄地址, 而句柄中包含了对象实例数据与类型数据的具体各自的地址信息:
直接指针(HotSpot使用): 该方式Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息, reference中存储的直接就是对象地址:
这两种对象访问方式各有优点: 使用句柄来访问的最大好处是reference中存储的是稳定句柄地址, 在对象被移动(垃圾收集时移动对象是很是广泛的行为)时只会改变句柄中的实例数据指针,而reference自己不变. 而使用直接指针最大的好处就是速度更快, 它节省了一次指针定位的时间开销,因为对象访问很是频繁, 所以这类开销积小成多也是一项很是可观的执行成本.