Java虚拟机--Java运行时数据区

时间 2020-04-19

原文原文链接

java运行时数据区域

1.java运行时数据区域

Java 虚拟机在执行Java程序的过程当中会把它所管理的内存划分为若干个不一样的数据区域。这些数据区域有各自的用途，以及建立和销毁的时间，有的内存区域随着虚拟机进程启动而一直存在，有些区域则是依赖用户线程的启动和结束而创建和销毁。Java虚拟机所管理的内存主要包括如下几个运行时数据区域： java

1.1 程序计数器

       程序计数器是一块较小的内存空间，它能够看作是当前线程所执行的字节码的行号指示器。在Java虚拟机的概念模型里，字节码解释器工做时就是经过改变这个计数器的值来选取下一条须要执行的字节码指令，它是程序控制流的指示器，分支、循环、跳转、异常处理、线程恢复等基础功能都须要依赖这个计数器来完成。
        因为Java虚拟机中多线程是经过轮流切换、分配处理执行时间的方式来实现的。在任什么时候刻，一个处理器智能执行一条线程中的指令，即每一个线程都有独立的线程计数器，各条线程之间计数器互不影响，独立存储，因此程序计数器是线程私有的。
       若是线程正在执行的是一个Java方法，这个计数器记录的是正在执行的虚拟机字节码指令的地址；若是正在执行的是本地（Native）方法，这个计数器值则应为空（Undefined）。此内存区域是惟一一个在《Java虚拟机规范》中没有规定任何OutOfMemoryError状况的区域算法

1.2java虚拟机栈

       虚拟机栈描述的是Java方法执行的线程内存模型；与程序计数器同样，也是属于线程私有的，生命周期与线程相同；每一个方法被执行的时候，java虚拟机都会同步建立一个栈帧，用于存储局部变量表、操做数栈、动态连接、方法出口等信息。一个方法被调用直至执行完毕的过程，就对应一个栈帧在虚拟机中入栈到出栈的过程。
       局部变量表存放了编译期可知的各类Java虚拟机基本数据类型（boolean、int、double、float、char、byte、long、short）、对象引用和returnAddress类型。
       这些数据类型在局部变量表中的存储空间以局部变量槽来表示，其中64位长度的long和double类型的数据会占用两个变量槽，其他的数据类型只占用一个。局部变量表所需的内存空间在编译期间完成分配，当进入一个方法时，这个方法须要在栈帧中分配多大的局部变量空间是彻底肯定的，在方法运行期间不会改变变量表的大小。
       在java虚拟机规范中，对虚拟机栈这个区域规定了两种异常情况：若是线程请求的栈深度大于虚拟机所容许的深度，将抛出StackOverflowError异常；若是虚拟机栈能够动态扩展，若是扩展时没法申请到足够的内存，就会抛出OutOfMemoryError异常。编程

1.3本地方法栈

本地方法栈与虚拟机栈所发挥的做用是很是类似的，其区别只有虚拟机栈为虚拟机执行Java方法服务。而本地方法栈则为虚拟机使用到的Native方法服务。
本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。数组

1.4java堆

对于大多数应用来讲，Java堆是Java虚拟机所管理的内存中最大的一块。Java堆是被全部线程共享的一块内存区域，在虚拟机启动时建立，此内存区域的惟一目的就是存放对象实例，几乎全部的对象实例都在这里分配内存。全部的对象实例以及数组都在堆上分配内存。可是随着JIT编译器的发展与逃逸分析技术逐渐成熟，栈上分配、标量替换优化技术将会致使一些微妙的变化发生，全部的对象都分配在堆上也渐渐变得不那么绝对了。缓存

java堆是垃圾收集器管理的主要区域，所以不少时候也被称做GC堆。从内存回收的角度来看，因为如今手机器基本都采用分代收集算法，因此Java堆中能够细分为：新生代、老年代；在细致一点能够分为Eden空间、From Survivor空间、To Survivor空间等。
安全

若是从分配内存的角度看，全部线程共享的Java堆中能够划分出多个线程私有的分配缓冲区（Thread Local Allocation Buffer，TLAB），以提高对象分配时的效率。不过不管从什么角度，不管如何划分，都不会改变Java堆中存储内容的共性，不管是哪一个区域，存储的都只能是对象的实例，将Java 堆细分的目的只是为了更好地回收内存，或者更快地分配内存。
根据《Java虚拟机规范》的规定，Java堆能够处于物理上不连续的内存空间中，但在逻辑上它应该被视为连续的，这点就像咱们用磁盘空间去存储文件同样，并不要求每一个文件都连续存放。但对于大对象（典型的如数组对象），多数虚拟机实现出于实现简单、存储高效的考虑，极可能会要求连续的内存空间。 Java堆既能够被实现成固定大小的，也能够是可扩展的，不过当前主流的Java虚拟机都是按照可扩展来实现的（经过参数-Xmx和-Xms设定）。若是在Java堆中没有内存完成实例分配，而且堆也没法再扩展时，Java虚拟机将会抛出OutOfMemoryError异常。

1.5方法区

       方法区与Java堆同样，是各个线程共享的内存区域，它用于存储已被虚拟机加载的类信息、常量、静态变量、即便编译器编译后的代码等数据。
       对于习惯在HotSpot虚拟机上开发、部署程序的开发者来讲，不少人都更愿意把方法区成为“永久代”，本质上二者并不等价，仅仅是由于HostSpot虚拟机的设计团队选择把GC分代收集扩展至方法区，或者说使用永久代来实现方法区而已，这样HotSpot的垃圾收集器能够像管理Java堆同样管理这部份内存，可以省去专门为方法区编写内存管理代码的工做。
       《Java虚拟机规范》对方法区的约束是很是宽松的，除了和Java堆同样不须要连续的内存和能够选择固定大小或者可扩展外，甚至还能够选择不实现垃圾收集。相对而言，垃圾收集行为在这个区域的确是比较少出现的，但并不是数据进入了方法区就如永久代的名字同样“永久”存在了。这区域的内存回收目标主要是针对常量池的回收和对类型的卸载，通常来讲这个区域的回收效果比较难使人满意，尤其是类型的卸载，条件至关苛刻，可是这部分区域的回收有时又确实是必要的。之前Sun公司的Bug列表中，曾出现过的若干个严重的Bug就是因为低版本的HotSpot虚拟机对此区域未彻底回收而致使内存泄漏。
       根据《Java虚拟机规范》的规定，若是方法区没法知足新的内存分配需求时，将抛出 OutOfMemoryError异常。数据结构

1.6运行时常量池

       运行时常量池（Runtime Constant Pool）是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外，还有一项信息是常量池表（Constant Pool Table），用于存放编译期生成的各类字面量与符号引用，这部份内容将在类加载后存放到方法区的运行时常量池中。
       运行时常量池相对于Class文件常量池的另一个重要特征是具有动态性，Java语言并不要求常量必定只有编译期才能产生，也就是说，并不是预置入Class文件中常量池的内容才能进入方法区运行时常量池，运行期间也能够将新的常量放入池中，这种特性被开发人员利用得比较多的即是String类的 intern()方法。
       既然运行时常量池是方法区的一部分，天然受到方法区内存的限制，当常量池没法再申请到内存时会抛出OutOfMemoryError异常。多线程

1.7直接内存

       直接内存（Direct Memory）并非虚拟机运行时数据区的一部分，也不是《Java虚拟机规范》中定义的内存区域。可是这部份内存也被频繁地使用，并且也可能致使OutOfMemoryError异常出现。
       在JDK 1.4中新加入了NIO（New Input/Output）类，引入了一种基于通道（Channel）与缓冲区（Buffer）的I/O方式，它可使用Native函数库直接分配堆外内存，而后经过一个存储在Java堆里面的 DirectByteBuffer对象做为这块内存的引用进行操做。这样能在一些场景中显著提升性能，由于避免了在Java堆和Native堆中来回复制数据。
        显然，本机直接内存的分配不会受到Java堆大小的限制，可是，既然是内存，则确定仍是会受到本机总内存（包括物理内存、SWAP分区或者分页文件）大小以及处理器寻址空间的限制，通常服务器管理员配置虚拟机参数时，会根据实际内存去设置-Xmx等参数信息，但常常忽略掉直接内存，使得各个内存区域总和大于物理内存限制（包括物理的和操做系统级的限制），从而致使动态扩展时出现 OutOfMemoryError异常。并发

2.HotSpot虚拟机对象探秘

2.1 对象建立

        Java是一门面向对象的编程语言，Java程序运行过程当中无时无刻都有对象被建立出来。在语言层面上，建立对象一般（例外：复制、反序列化）仅仅是一个new关键字而已，而在虚拟机中，对象的建立又是怎样一个过程呢？
        当Java虚拟机遇到一条字节码new指令时，首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用，而且检查这个符号引用表明的类是否已被加载、解析和初始化过。若是没有，那必须先执行相应的类加载过程。
        在类加载检查经过后，接下来虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后即可彻底肯定，为对象分配空间的任务实际上便等同于把一块肯定大小的内存块从Java堆中划分出来。假设Java堆中内存是绝对规整的，全部被使用过的内存都被放在一边，空闲的内存被放在另外一边，中间放着一个指针做为分界点的指示器，那所分配内存就仅仅是把那个指针向空闲空间方向挪动一段与对象大小相等的距离，这种分配方式称为“指针碰撞”（Bump The Pointer）。但若是Java堆中的内存并非规整的，已被使用的内存和空闲的内存相互交错在一块儿，那就没有办法简单地进行指针碰撞了，虚拟机就必须维护一个列表，记录上哪些内存块是可用的，在分配的时候从列表中找到一块足够大的空间划分给对象实例，并更新列表上的记录，这种分配方式称为“空闲列表”（Free List）。选择哪一种分配方式由Java堆是否规整决定，而Java堆是否规整又由所采用的垃圾收集器是否带有空间压缩整理（Compact）的能力决定。所以，当使用Serial、ParNew等带压缩整理过程的收集器时，系统采用的分配算法是指针碰撞，既简单又高效；而当使用CMS这种基于清除（Sweep）算法的收集器时，理论上就只能采用较为复杂的空闲列表来分配内存。
        除如何划分可用空间以外，还有另一个须要考虑的问题：对象建立在虚拟机中是很是频繁的行为，即便仅仅修改一个指针所指向的位置，在并发状况下也并非线程安全的，可能出现正在给对象A分配内存，指针还没来得及修改，对象B又同时使用了原来的指针来分配内存的状况。解决这个问题有两种可选方案：一种是对分配内存空间的动做进行同步处理——实际上虚拟机是采用CAS配上失败重试的方式保证更新操做的原子性；另一种是把内存分配的动做按照线程划分在不一样的空间之中进行，即每一个线程在Java堆中预先分配一小块内存，称为本地线程分配缓冲（ThreadLocalAllocationBuffer，TLAB），哪一个线程要分配内存，就在哪一个线程的本地缓冲区中分配，只有本地缓冲区用完了，分配新的缓存区时才须要同步锁定。虚拟机是否使用TLAB，能够经过-XX：+/-UseTLAB参数来设定。
        内存分配完成以后，虚拟机必须将分配到的内存空间（但不包括对象头）都初始化为零值，若是使用了TLAB的话，这一项工做也能够提早至TLAB分配时顺便进行。这步操做保证了对象的实例字段在Java代码中能够不赋初始值就直接使用，使程序能访问到这些字段的数据类型所对应的零值。
        接下来，Java虚拟机还要对对象进行必要的设置，例如这个对象是哪一个类的实例、如何才能找到类的元数据信息、对象的哈希码（实际上对象的哈希码会延后到真正调用Object::hashCode()方法时才计算）、对象的GC分代年龄等信息。这些信息存放在对象的对象头（ObjectHeader）之中。根据虚拟机当前运行状态的不一样，如是否启用偏向锁等，对象头会有不一样的设置方式。关于对象头的具体内容，稍后会详细介绍。编程语言

2.2 对象的内存布局

在HotSpot虚拟机里，对象在堆内存中的存储布局能够划分为三个部分：对象头（Header）、实例数据（InstanceData）和对齐填充（Padding）。

HotSpot虚拟机对象的对象头部分包括两类信息。第一类是用于存储对象自身的运行时数据，如哈希码（HashCode）、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等，这部分数据的长度在32位和64位的虚拟机（未开启压缩指针）中分别为32个比特和64个比特，官方称它为“MarkWord”。对象须要存储的运行时数据不少，其实已经超出了3二、64位Bitmap结构所能记录的最大限度，但对象头里的信息是与对象自身定义的数据无关的额外存储成本，考虑到虚拟机的空间效率，MarkWord被设计成一个有着动态定义的数据结构，以便在极小的空间内存储尽可能多的数据，根据对象的状态复用本身的存储空间。

对象头的另一部分是类型指针，即对象指向它的类型元数据的指针，Java虚拟机经过这个指针来肯定该对象是哪一个类的实例。并非全部的虚拟机实现都必须在对象数据上保留类型指针，换句话说，查找对象的元数据信息并不必定要通过对象自己。此外，若是对象是一个Java数组，那在对象头中还必须有一块用于记录数组长度的数据，由于虚拟机能够经过普通Java对象的元数据信息肯定Java对象的大小，可是若是数组的长度是不肯定的，将没法经过元数据中的信息推断出数组的大小。
对象的第三部分是对齐填充，这并非必然存在的，也没有特别的含义，它仅仅起着占位符的做用。因为HotSpot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍，换句话说就是任何对象的大小都必须是8字节的整数倍。对象头部分已经被精心设计成正好是8字节的倍数（1倍或者2倍），所以，若是对象实例数据部分没有对齐的话，就须要经过对齐填充来补全。

2.3 对象的访问定位

建立对象天然是为了后续使用该对象，咱们的Java程序会经过栈上的reference数据来操做堆上的具体对象。因为reference类型在《Java虚拟机规范》里面只规定了它是一个指向对象的引用，并无定义这个引用应该经过什么方式去定位、访问到堆中对象的具体位置，因此对象访问方式也是由虚拟机实现而定的，主流的访问方式主要有使用句柄和直接指针两种：

·若是使用句柄访问的话，Java堆中将可能会划分出一块内存来做为句柄池，reference中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与类型数据各自具体的地址信息。
若是使用直接指针访问的话，Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关信息，reference中存储的直接就是对象地址，若是只是访问对象自己的话，就不须要多一次间接访问的开销。

==================END ==================