JVM是Java Virtual Machine(Java 虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是经过在实际的计算机上仿真模拟各类计算机功能来实现的。java
Java语言的一个很是重要的特色就是平台无关性。而使用Java虚拟机是实现这一特色的关键。通常的高级语言若是要在不一样的平台上运行,至少须要编译成不一样的目标代码。而引入Java语言虚拟机后,Java语言在不一样平台上运行时不须要从新编译。Java语言使用Java虚拟机屏蔽了与具体平台相关的信息,使得Java语言编译程序只需生成在Java虚拟机上运行的目标代码(字节码),就能够在多种平台上不加修改地运行。Java虚拟机在执行字节码时,把字节码解释成具体平台上的机器指令执行。这就是Java的可以“一次编译,处处运行”的缘由。算法
JVM整体上是由类装载子系统(ClassLoader)、运行时数据区、执行引擎、垃圾收集这四个部分组成。其中咱们最为关注的运行时数据区,也就是JVM的内存部分则是由方法区(Method Area)、JAVA堆(Java Heap)、虚拟机栈(JVM Stack)、程序计数器、本地方法栈(Native Method Stack)这几部分组成。数组
Class Loader类加载器负责加载.class文件,class文件在文件开头有特定的文件标示,而且ClassLoader负责class文件的加载等,至于它是否能够运行,则由Execution Engine决定。缓存
栈管运行,堆管存储。JVM调优主要是优化Java堆和方法区。多线程
方法区是各线程共享的内存区域,它用于存储已被JVM加载的类信息、常量、静态变量、运行时常量池等数据。并发
Java堆是各线程共享的内存区域,在JVM启动时建立,这块区域是JVM中最大的, 用于存储应用的对象和数组,也是GC主要的回收区,一个 JVM 实例只存在一个堆内存,堆内存的大小是能够调节的。类加载器读取了类文件后,须要把类、方法、常变量放到堆内存中,以方便执行器执行,堆内存分为三部分:新生代、老年代、永久代。函数
说明:优化
Jdk1.6及以前:常量池分配在永久代 。spa
Jdk1.7:有,但已经逐步“去永久代” 。线程
Jdk1.8及以后:无永久代,改用元空间代替(java.lang.OutOfMemoryError: PermGen space,这种错误将不会出如今JDK1.8中)。
Java栈是线程私有的,是在线程建立时建立,它的生命期是跟随线程的生命期,线程结束栈内存也就释放,对于栈来讲不存在垃圾回收问题,只要线程一结束该栈就Over,生命周期和线程一致。基本类型的变量和对象的引用变量都是在函数的栈内存中分配。
每一个方法执行的时候都会建立一个栈帧,栈帧中主要存储3类数据:
局部变量表:输入参数和输出参数以及方法内的变量;
栈操做:记录出栈和入栈的操做;
栈帧数据:包括类文件、方法等等。
栈中的数据都是以栈帧的格式存在,栈帧是一个内存区块,是一个数据集,是一个有关方法和运行期数据的数据集。每个方法被调用直至执行完成的过程,就对应着一个栈帧在栈中从入栈到出栈的过程。
本地方法栈和JVM栈发挥的做用很是类似,也是线程私有的,区别是JVM栈为JVM执行Java方法(也就是字节码)服务,而本地方法栈为JVM使用到的Native方法服务。它的具体作法是在本地方法栈中登记native方法,在执行引擎执行时加载Native Liberies.有的虚拟机(好比Sun Hotpot)直接把二者合二为一。
程序计数器是一块很是小的内存空间,几乎能够忽略不计,每一个线程都有一个程序计算器,是线程私有的,能够看做是当前线程所执行的字节码的行号指示器,指向方法区中的方法字节码(下一个将要执行的指令代码),由执行引擎读取下一条指令。
运行时常量池是方法区的一部分,用于存放编译器生成的各类字面量和符号引用,这部份内容将在类加载后存放到方法区的运行时常量池中。相较于Class文件常量池,运行时常量池更具动态性,在运行期间也能够将新的变量放入常量池中,而不是必定要在编译时肯定的常量才能放入。最主要的运用即是String类的intern()方法。
执行引擎执行包在装载类的方法中的指令,也就是方法。执行引擎以指令为单位读取Java字节码。它就像一个CPU同样,一条一条地执行机器指令。每一个字节码指令都由一个1字节的操做码和附加的操做数组成。执行引擎取得一个操做码,而后根据操做数来执行任务,完成后就继续执行下一条操做码。
不过Java字节码是用一种人类能够读懂的语言编写的,而不是用机器能够直接执行的语言。所以,执行引擎必须把字节码转换成能够直接被JVM执行的语言。字节码能够经过如下两种方式转换成合适的语言:
解释器: 一条一条地读取,解释并执行字节码执行,因此它能够很快地解释字节码,可是执行起来会比较慢。这是解释执行语言的一个缺点。
即时编译器:用来弥补解释器的缺点,执行引擎首先按照解释执行的方式来执行,而后在合适的时候,即时编译器把整段字节码编译成本地代码。而后,执行引擎就没有必要再去解释执行方法了,它能够直接经过本地代码去执行。执行本地代码比一条一条进行解释执行的速度快不少,编译后的代码能够执行的很快,由于本地代码是保存在缓存里的。
垃圾收集即垃圾回收,简单的说垃圾回收就是回收内存中再也不使用的对象。所谓使用中的对象(已引用对象),指的是程序中有指针指向的对象;而未使用中的对象(未引用对象),则没有被任何指针给指向,所以占用的内存也能够被回收掉。
垃圾回收的基本步骤分两步:
查找内存中再也不使用的对象(GC判断策略)
释放这些对象占用的内存(GC收集算法)
引用计数算法是给对象添加一个引用计数器,每当有一个引用它时,计数器值就加1;当引用失效时,计数器值就减1;任什么时候刻计数器都为0的对象就是不可能再被使用的对象。缺点:很难解决对象之间相互循环引用的问题。
根搜索算法的基本思路就是经过一系列名为“GC Roots”的对象做为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(也就是说从GC Roots到这个对象不可达)时,则证实此对象是不可用的。
在Java语言里,可做为GC Roots的对象包括如下几种:
虚拟机栈(栈帧中的本地变量表)中引用的对象;
方法区中类静态属性引用的对象;
方法区中常量应用的对象;
本地方法栈中JNI(Native方法)引用的对象。
注:在根搜索算法中不可达的对象,也并不是是“非死不可”的,由于要真正宣告一个对象死亡,至少要经历两次标记过程:第一次是标记没有与GC Roots相链接的引用链;第二次是GC对在F-Queue执行队列中的对象进行的小规模标记(对象须要覆盖finalize()方法且没被调用过)。
标记-清楚算法采用从根集合(GC Roots)进行扫描,首先标记出全部须要回收的对象(根搜索算法),标记完成后统一回收掉全部被标记的对象。
该算法有两个问题:
效率问题:标记和清除过程的效率都不高;
空间问题:标记清除后会产生大量不连续的内存碎片, 空间碎片太多可能会致使在运行过程当中须要分配较大对象时没法找到足够的连续内存而不得不提早触发另外一次垃圾收集。
复制算法是将可用内存按容量划分为大小相等的两块, 每次只用其中一块, 当这一块的内存用完, 就将还存活的对象复制到另一块上面, 而后把已使用过的内存空间一次清理掉。
标记整理算法的标记过程与标记清除算法相同, 但后续步骤再也不对可回收对象直接清理, 而是让全部存活的对象都向一端移动,而后清理掉端边界之外的内存。
分代收集算法是目前大部分JVM的垃圾收集器采用的算法。它的核心思想是根据对象存活的生命周期将内存划分为若干个不一样的区域。通常状况下将堆区划分为老年代(Tenured Generation)和新生代(Young Generation),在堆区以外还有一个代就是永久代(Permanet Generation)。老年代的特色是每次垃圾收集时只有少许对象须要被回收,而新生代的特色是每次垃圾回收时都有大量的对象须要被回收,那么就能够根据不一样代的特色采起最适合的收集算法。
新生代(Young Generation)的回收算法(以复制算法为主)
全部新生成的对象首先都是放在年轻代的。年轻代的目标就是尽量快速的收集掉那些生命周期短的对象。
新生代内存按照8:1:1的比例分为一个eden区和两个survivor(survivor0,survivor1)区。一个Eden区,两个 Survivor区(通常而言)。大部分对象在Eden区中生成。回收时先将eden区存活对象复制到一个survivor0区,而后清空eden区,当这个survivor0区也存放满了时,则将eden区和survivor0区存活对象复制到另外一个survivor1区,而后清空eden和这个survivor0区,此时survivor0区是空的,而后将survivor0区和survivor1区交换,即保持survivor1区为空, 如此往复。
当survivor1区不足以存放 eden和survivor0的存活对象时,就将存活对象直接存放到老年代。如果老年代也满了就会触发一次Full GC(Major GC),也就是新生代、老年代都进行回收。
新生代发生的GC也叫作Minor GC,MinorGC发生频率比较高(不必定等Eden区满了才触发)。
老年代(Tenured Generation)的回收算法(以标记-清除、标记-整理为主)
在年轻代中经历了N次垃圾回收后仍然存活的对象,就会被放到老年代中。所以,能够认为老年代中存放的都是一些生命周期较长的对象。
内存比新生代也大不少(大概比例是1:2),当老年代内存满时触发Major GC即Full GC,Full GC发生频率比较低,老年代对象存活时间比较长,存活率标记高。
永久代(Permanet Generation)的回收算法
用于存放静态文件,如Java类、方法等。永久代对垃圾回收没有显著影响,可是有些应用可能动态生成或者调用一些class,例如Hibernate 等,在这种时候须要设置一个比较大的永久代空间来存放这些运行过程当中新增的类。永久代也称方法区。方法区主要回收的内容有:废弃常量和无用的类。对于废弃常量也可经过根搜索算法来判断,可是对于无用的类则须要同时知足下面3个条件:
该类全部的实例都已经被回收,也就是Java堆中不存在该类的任何实例;
加载该类的ClassLoader已经被回收;
该类对应的java.lang.Class对象没有在任何地方被引用,没法在任何地方经过反射访问该类的方法。
新生代单线程收集器,标记和清理都是单线程,优势是简单高效。是client级别默认的GC方式,能够经过-XX:+UseSerialGC来强制指定。
老年代单线程收集器,Serial收集器的老年代版本。
新生代多线程收集器,其实就是Serial收集器的多线程版本,在多核CPU环境下有着比Serial更好的表现。
新生代并行的多线程收集器,追求高吞吐量,高效利用CPU。吞吐量通常为99%, 吞吐量= 用户线程时间/(用户线程时间+GC线程时间)。适合后台应用等对交互相应要求不高的场景。是server级别默认采用的GC方式,可用-XX:+UseParallelGC来强制指定,用-XX:ParallelGCThreads=4来指定线程数。
老年代并行的多线程收集器,Parallel Scavenge收集器的老年代版本,并行收集器,吞吐量优先。
CMS收集器是一种以获取最短回收停顿时间为目标的收集器,CMS收集器是基于“标记--清除”(Mark-Sweep)算法实现的,整个过程分为四个步骤:
初始标记: 标记GC Roots能直接关联到的对象,速度很快;
并发标记: 进行GC Roots Tracing的过程;
从新标记: 修正并发标记期间因用户程序继续运做而致使标记产生变更的那一部分对象的标记记录,这个阶段的停顿时间通常会比初始标记阶段稍长一些,但比并发标记时间短;
并发清除: 整个过程当中耗时最长的并发标记和并发清除过程收集器线程均可以与用户线程一块儿工做,因此,从整体上来讲,CMS收集器的内存回收过程是与用户线程一块儿并发执行的。
优势:并发收集、低停顿
缺点:对CPU资源很是敏感、没法处理浮动垃圾、产生大量空间碎片。
G1是一款面向服务端应用的垃圾收集器,是基于“标记-整理”算法实现的,与其余GC收集器相比,G1具有以下特色:
并行与并发
分代收集
空间整合
可预测性的停顿
G1运做步骤:
初始标记(stop the world事件,CPU停顿只处理垃圾)
并发标记(与用户线程并发执行)
最终标记(stop the world事件,CPU停顿处理垃圾)
筛选回收(stop the world事件,根据用户指望的GC停顿时间回收)
做者:郭晓利
来源:宜信技术学院