深刻理解JVM——（一）JVM的内存区域划分

时间 2019-11-29

标签深刻理解 jvm 内存区域划分栏目 Java 繁體版

原文原文链接

说到Java内存区域，可能不少人第一反应是“堆栈”。首先堆栈不是一个概念，而是两个概念，堆和栈是两块不一样的内存区域，简单理解的话，堆是用来存放对象而栈是用来执行程序的。其次，堆内存和栈内存的这种划分方式比较粗糙，这种划分方式只能说明大多数程序员最关注的、与对象内存分配关系最密切的内存区域是这两块，Java内存区域的划分实际上远比这复杂。对于Java程序员来讲，在虚拟机自动内存管理机制的帮助下，再也不须要为每个new操做去配对delete/free代码，不容易出现内存泄露和内存溢出问题。可是，也正是由于Java把内存控制权交给了虚拟机，一旦出现内存泄露和内存溢出的问题，就难以排查，所以一个好的Java程序员应该去了解虚拟机的内存区域以及会引发内存泄露和内存溢出的场景。java

1、运行时内存区域

Java虚拟机（JVM）内部定义了程序在运行时须要使用到的内存区域程序员

之因此要划分这么多区域出来是由于这些区域都有本身的用途，以及建立和销毁的时间。有些区域随着虚拟机进程的启动而存在，有的区域则依赖用户线程的启动和结束而销毁和创建。图中绿色部分就是全部线程之间共享的内存区域，而其他部分则是线程运行时独有的数据区域，从这个分类角度来看一下这几个数据区。算法

一、线程独有的内存区域

（1）PROGRAM COUNTER REGISTER，程序计数器

这块内存区域很小，它是当前线程所执行的字节码的行号指示器，字节码解释器经过改变这个计数器的值来选取下一条须要执行的字节码指令。安全

在JVM规范中规定，若是线程执行的是非native方法，则程序计数器中保存的是当前须要执行的指令的地址；若是线程执行的是native方法，则程序计数器中的值是undefined。服务器

因为程序计数器中存储的数据所占空间的大小不会随程序的执行而发生改变，所以，对于程序计数器是不会发生内存溢出现象(OutOfMemory)的。数据结构

总结：函数

当前线程所执行的字节码的行号指示器;布局

当前线程私有;性能

不会出现OutOfMemoryError状况。线程

（2）JAVA STACK，虚拟机栈

Java栈也称做虚拟机栈（Java Vitual Machine Stack），也就是咱们经常所说的栈，跟C语言的数据段中的栈相似。事实上，Java栈是Java方法执行的内存模型。为何这么说呢？下面就来解释一下其中的缘由。

Java栈中存放的是一个个的栈帧，每一个栈帧对应一个被调用的方法，在栈帧中包括局部变量表(Local Variables)、操做数栈(Operand Stack)、指向当前方法所属的类的运行时常量池（运行时常量池的概念在方法区部分会谈到）的引用(Reference to runtime constant pool)、方法返回地址(Return Address)和一些额外的附加信息。当线程执行一个方法时，就会随之建立一个对应的栈帧，并将创建的栈帧压栈。当方法执行完毕以后，便会将栈帧出栈。所以可知，线程当前执行的方法所对应的栈帧一定位于Java栈的顶部。讲到这里，你们就应该会明白为何在使用递归方法的时候容易致使栈内存溢出的现象了以及为何栈区的空间不用程序员去管理了（固然在Java中，程序员基本不用关系到内存分配和释放的事情，由于Java有本身的垃圾回收机制），这部分空间的分配和释放都是由系统自动实施的。对于全部的程序设计语言来讲，栈这部分空间对程序员来讲是不透明的。下图表示了一个Java栈的模型：

局部变量表，顾名思义，想必不用解释你们应该明白它的做用了吧。就是用来存储方法中的局部变量（包括在方法中声明的非静态变量以及函数形参）。对于基本数据类型的变量，则直接存储它的值，对于引用类型的变量，则存的是指向对象的引用。局部变量表的大小在编译器就能够肯定其大小了，所以在程序执行期间局部变量表的大小是不会改变的。
操做数栈，想必学过数据结构中的栈的朋友想必对表达式求值问题不会陌生，栈最典型的一个应用就是用来对表达式求值。想一想一个线程执行方法的过程当中，实际上就是不断执行语句的过程，而归根到底就是进行计算的过程。所以能够这么说，程序中的全部计算过程都是在借助于操做数栈来完成的。
指向运行时常量池的引用，由于在方法执行的过程当中有可能须要用到类中的常量，因此必需要有一个引用指向运行时常量。
方法返回地址，当一个方法执行完毕以后，要返回以前调用它的地方，所以在栈帧中必须保存一个方法返回地址。

因为每一个线程正在执行的方法可能不一样，所以每一个线程都会有一个本身的Java栈，互不干扰。

生命周期和线程相同。每一个方法执行的同时都会建立一个栈帧，用于存储局部变量表、操做数栈、动态连接、方法出口等信息，每个方法从调用直至执行完毕的过程，就对应着一个栈帧在虚拟机中入栈到出栈的过程。栈的大小和具体JVM的实现有关，一般在256K~756K之间。

总结：

线程私有，生命周期与线程相同;

java方法执行的内存模型，每一个方法执行的同时都会建立一个栈帧，存储局部变量表(基本类型、对象引用)、操做数栈、动态连接、方法出口等信息;

StackOverflowError异常：当线程请求的栈深度大于虚拟机所容许的深度;

OutOfMemoryError异常：若是栈的扩展时没法申请到足够的内存。

（3）NATIVE METHOD STACK，本地方法栈

本地方法栈与Java栈的做用和原理很是类似。区别只不过是Java栈是为执行Java方法服务的，而本地方法栈则是为执行本地方法（Native Method）服务的。在JVM规范中，并无对本地方发展的具体实现方法以及数据结构做强制规定，虚拟机能够自由实现它。在HotSopt虚拟机中直接就把本地方法栈和Java栈合二为一。

二、线程间共享的内存区域

（1）HEAP，堆

大多数应用，堆都是Java虚拟机所管理的内存中最大的一块，它在虚拟机启动时建立，此内存惟一的目的就是存放对象实例。因为如今垃圾收集器采用的基本都是分代收集算法，因此堆还能够细分为新生代和老年代，再细致一点还有Eden区、From Survivior区、To Survivor区。

总结： 能够经过-Xmx和-Xms控制堆的大小;

OutOfMemoryError异常：当在堆中没有内存完成实例分配，且堆也没法再扩展时。

（2）METHOD AREA，方法区

这块区域用于存储虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据，虚拟机规范是把这块区域描述为堆的一个逻辑部分的，但实际它应该是要和堆区分开的。从上面提到的分代收集算法的角度看，HotSpot中，方法区≈永久代。不过JDK 7以后，咱们使用的HotSpot应该就没有永久代这个概念了，会采用Native Memory来实现方法区的规划了。

总结：

线程间共享;

用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据;

OutOfMemoryError异常：当方法区没法知足内存的分配需求时。

（3）RUNTIME CONSTANT POOL，运行时常量池

上面的图中没有画出来，由于它是方法区的一部分。Class文件中除了有类的版本信息、字段、方法、接口等描述信息外，还有一项信息就是常量池，用于存放编译期间生成的各类字面量和符号引用，这部份内容将在类加载后进入方法区的运行时常量池中，另外翻译出来的直接引用也会存储在这个区域中。这个区域另一个特色就是动态性，Java并不要求常量就必定要在编译期间才能产生，运行期间也能够在这个区域放入新的内容，String.intern()方法就是这个特性的应用。

总结：

方法区的一部分;

用于存放编译期生成的各类字面量与符号引用;

OutOfMemoryError异常：当常量池没法再申请到内存时。

三、直接内存

直接内存并非虚拟机运行时数据区的一部分，也不是Java虚拟机规范中定义的内存区域。可是这部份内存也被频繁地使用，并且也可能致使内存溢出问题。JDK1.4中新增长了NIO，引入了一种基于通道与缓冲区的I/O方式，它可使用Native函数库直接分配堆外内存，而后经过一个存储在Java堆中的DirectByteBuffer对象做为这块内存的引用进行操做。这样能在一些场景中显著提升性能，由于避免了在Java堆和Native堆中来回复制数据。显然，本机直接内存的分配不会受到Java堆大小的限制，可是，既然是内存，确定仍是会受到本机总内存（包括RAM、SWAP区）大小以及处理器寻址空间的限制。

总结：

NIO可使用Native函数库直接分配堆外内存，堆中的DirectByteBuffer对象做为这块内存的引用进行操做;

大小不受Java堆大小的限制，受本机(服务器)内存限制;

OutOfMemoryError异常：系统内存不足时。

2、对象的建立

Java是一门面向对象的语言，Java程序运行过程当中无时无刻都有对象被建立出来。在语言层面上，建立对象（克隆、反序列化）就是一个new关键字而已，可是虚拟机层面上却不是如此。看一下在虚拟机层面上建立对象的步骤：

虚拟机遇到一条new指令，首先去检查这个指令的参数可否在常量池中定位到一个类的符号引用，而且检查这个符号引用表明的类是否已经被加载、解析和初始化。若是没有，那么必须先执行类的初始化过程。
类加载检查经过后，虚拟机为新生对象分配内存。对象所需内存大小在类加载完成后即可以彻底肯定，为对象分配空间无非就是从Java堆中划分出一块肯定大小的内存而已。这个地方会有两个问题：

第一个问题：分配内存的方式
- 若是内存是规整的，那么虚拟机将采用的是指针碰撞法来为对象分配内存。意思是全部用过的内存在一边，空闲的内存在另一边，中间放着一个指针做为分界点的指示器，分配内存就仅仅是把指针向空闲那边挪动一段与对象大小相等的距离罢了。若是垃圾收集器选择的是Serial、ParNew这种基于压缩算法的，虚拟机采用这种分配方式。
- 若是内存不是规整的，已使用的内存和未使用的内存相互交错，那么虚拟机将采用的是空闲列表法来为对象分配内存。意思是虚拟机维护了一个列表，记录上哪些内存块是可用的，在分配的时候从列表中找到一块足够大的空间划分给对象实例，并更新列表上的内容。若是垃圾收集器选择的是CMS这种基于标记-清除算法的，虚拟机采用这种分配方式。
另一个问题及时保证new对象时候的线程安全性。由于可能出现虚拟机正在给对象A分配内存，指针尚未来得及修改，对象B又同时使用了原来的指针来分配内存的状况。虚拟机采用了CAS配上失败重试的方式保证更新更新操做的原子性和TLAB两种方式来解决这个问题。

内存分配结束，虚拟机将分配到的内存空间都初始化为零值（不包括对象头）。这一步保证了对象的实例字段在Java代码中能够不用赋初始值就能够直接使用，程序能访问到这些字段的数据类型所对应的零值。
对对象进行必要的设置，例如这个对象是哪一个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息，这些信息存放在对象的对象头中。
执行<init>方法，把对象按照程序员的意愿进行初始化，这样一个真正可用的对象才算彻底产生出来。

3、对象的访问定位

创建对象是为了使用对象，Java程序须要经过栈上的reference（引用）数据来操做堆上的具体对象。好比咱们写了一句

Object obj = new Object()

而new Object()以后其实有两部份内容，一部分是类数据（好比表明类的Class对象）、一部分是实例数据。

因为reference在Java虚拟机规范中只是一个指向对象new Object()的引用obj，并无规定obj应该经过何种方式去定位、访问堆中对象的具体位置，因此对象访问方式也是取决于虚拟机而定的。主流方式有两种：

3.1句柄访问

java堆中将会划分出一块内存来做为句柄池，reference中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与类型数据各自的具体地址信息。访问对象时，首先须要经过引用类型的变量找到该对象的句柄，而后根据句柄中对象的地址找到对象。

3.2 指针访问

java堆对象的布局中必须考虑如何放置访问类型数据的相关信息，reference中存储的就是对象地址。从而不须要句柄池，经过引用可以直接访问对象。但对象所在的内存空间须要额外的策略存储对象所属的类信息的地址。

须要说明的是，HotSpot 采用第二种方式，即直接指针方式来访问对象，只须要一次寻址操做，因此在性能上比句柄访问方式快一倍。但像上面所说，它须要 额外的策略来存储对象在方法区中类信息的地址。