最近仍是在找工做,在面试某移动互联网公司以前认为本身对Java的GC机制已经至关了解,其余面试官问的时候也不存在问题,直到那天该公司一个作搜索的面试官问了我GC的问题,具体就是:老年代使用的是哪中垃圾回收算法,并详细解释第一步作什么,第二部作什么?这时候才发现具体一步一步怎么来的,确实不知道。那结果就可想而知,面试官就对我不感兴趣了。那一瞬间,感受本身不该该过度轻信别人的博客,要相信官方的文档,由于有些写博客的技术人员也许自身对某些技术都不是很了解,只是本身记录下学习和使用的经历,再或者文章多是从别人那里转发而来。因此,写下这篇文章,记录此次惨痛的教训,也但愿本身之后学东西可以追根溯源,知其然,更要知其因此然!前端
本文主要介绍,JVM的组件,自动垃圾收集器是如何工做的,分代垃圾收集器的收集过程,使如何用Visual VM来监视应用的虚拟机,以及JVM中垃圾收集器的种类。java
HotSpot JVM架构支持较强的基本特征和功能,此外还支持高性能和高吞吐率的特性。例如,JVM JIT编译器产生动态优化的代码,亦即,编译器是在Java运行的时候的时候进行优化,并为固然的系统架构生成高性能的目标机器指令。此外,通过对运行时环境和多线程垃圾回收器不断地设计和优化,如今的HotSpot JVM甚至在大型的系统上都具备较高的伸缩性。JVM 的主要组件包括:ClassLoader、运行时数据区和执行引擎。面试
与性能密切相关的JVM的关键组件,有堆、JIT编译器,垃圾收集器,在下图中这些组件用深色标注。算法
性能优化只须要关注这三个组件便可。堆是存储对象的地方,该区域由用户指定(能够在启动应用程序的时候指定)的垃圾回收器来管理。大多数优化选项都是经过配置堆的大小和选择最合适的垃圾回收器来实现。JIT编译器对性能也能产生比较大的影响,可是对于更新版本的(本文档为JDK1.7)JVM不多须要对其进行优化。数据库
一般数来,当优化一个Java应用的时候,咱们一般重点关心的是响应时间或吞吐量二者其中的一个。再此对这两个概念作下介绍,便于加深对优化的理解。编程
响应时间指的是应用或者系统对一个请求数据的回应。例如:性能优化
桌面UI对鼠标事件的响应速度服务器
网站返回页面的速度多线程
数据库查询返回的速度架构
因此,对于重点关心响应时间的应用,较长时间的应用暂停时不可接受的。咱们要作到尽量的提高响应速度,减小响应时间。
吞吐量重点关心特定时间内应用程序处理工做的最大值。例如,吞吐量能够经过如下形式来衡量:
给定时间内的完成的事物数量
一个小时你完成的批处理程序的个数
一个小时内完成的数据库查询的次数
这种状况下,应用程序能容忍较高的暂停时间,所以,高吞吐量的应用程序有更长的时间基准,快速响应是没必要考虑的。
自动垃圾收集机制是查看堆内存、区分在使用的对象和未使用的对象、删除未使用的对象的一个过程。对于使用对象或者引用对象,指的是你的程序持有一个指向那个对象的引用。对于未使用的对象或者是无引用对象,则不被你程序的任何部分持有引用。因此,无引用对象使用的内存是能够被从新回收利用的。
在类C语言的编程语言中,内存的分配和回收都是手动的。而在Java中,内存的回收是由垃圾回收器自动处理的。基本的步骤能够描述以下:
第一步是标记,经过这一步骤来区分哪块内存在使用,那哪块内存未使用。
引用对象用蓝色标识,未引用的对象用金色标识。在标记阶段,扫描全部的对象并判断。若是系统中全部的对象都要被扫描的,那么这一步骤可能很是耗时。
正常删除移除无引用对象,留下引用对象及指向空闲空间的指针。
内存分配器持有空闲内存的引用,这些空闲内存都连接到一个List中,当须要的时候能够分配给新的对象。
为了进一步改善性能,除了删除未引用的对象,用户也能够压缩存活的引用对象。把引用对象移动到一块儿,经过这种方法可使更快速、更方便的分配新的内存。
在早期的JVM上,不得不在全部的对象上进行标记-压缩,这显然是很是低效。随着愈来愈多的对象被分配,对象列表也逐渐增大,这就致使愈来愈长的垃圾回收时间。然而,根据经验咱们分析获得大部分对象的生命周期是很是短暂的。
下面是这些数据的一个例子,Y轴表明的是分配的字节数,X轴表明的是随着时间的推移分配的字节数。
从图中能够看到,随着时间的推移,分配后的对象遗留的愈来愈少。事实上,大多数对象有很是短的生命周期,从图中左边较高的值得宽度能够得出。
从上面对象分配行为中,咱们知道据此能够加强JVM的性能。所以,堆被分解为较小的三个部分或者三个代。具体分为:年轻代、老年代、持久代。
年轻代:全部建立的新对象都是在年轻代分配堆空间,在这一代变老。当年轻代被填满的时候,这就会致使一个小收集。若是对象的死亡率很高,小回收就能够得到优化。年轻代中死亡的对象越多,回收的速度也就越快。幸存对象逐渐变老(年纪增大),最终会移动到老年代。
全局暂停事件:全部的小收集都是一个个全局暂停事件。这意味着全部的应用线程都会中止,直到收集操做完成。小回收总会致使全局暂停事件。
老年代:老年代用于存储较长生命周期的对象。典型的说来就是,为年轻代对象设置了阈值,当年轻代逐渐变老,到达这个阈值的时候,对象就会被移动到老年代。随着时间的推移,老年代也会被填满,最终致使老年代也要进行垃圾回收。这个事件叫作大收集。
大收集也是全局暂停事件。一般大收集比较慢,由于它涉及到全部的存活对象。因此,对于对相应时间要求高的应用,应该将大收集最小化。此外,对于大收集,全局暂停事件的暂停时长会受到用于老年代的垃圾回收器的影响。
持久代:持久代存储了描述应用程序类和方法的元数据,JVM运行应用程序的时候须要这些元数据。持久代由JVM在运行时基于应用程序所使用的类产生。此外,Java SE类库的类和方法可能也存储在这里。
若是JVM发现有些类不在被其余类所须要,同时其余类须要更多的空间,这时候这些类可能就会被垃圾回收。
从上面的介绍中咱们已经理解了为何堆被分红不一样的代,下面咱们就须要更精确的理解这些空间是如何进行交互的。下面的一组图片展现了JVM中垃圾回收的通常过程,从对象分配到对象逐渐变老。
如今咱们已经知道垃圾收集器的一些基本原理,而且借助VisualVM能够观察到垃圾收集器的实时表现。本节将会详细讲解Java可使用的垃圾回收器,以及在命令行如何选用配置它们。配置JVM有不少能够用的命令行参数,本节选用经常使用的配置参数进行详细解。
与堆配置相关的参数
Java中有不少可使用的命令行参数,这一节将会介绍经常使用的一些命令行参数。
参数 | 描述 |
-Xms | JVM启动的时候设置初始堆的大小 |
-Xmx | 设置最大堆的大小 |
-Xmn | 设置年轻代的大小 |
-XX:PermSize | 设置持久代的初始的大小 |
-XX:MaxPermSize | 设置持久代的最大值 |
在Java SE 5和6中,串行收集器是客户端环境(client-style machines)机器的默认设置。在这种状况下,小垃圾收集和大垃圾收集都是串行进行的(使用单个的虚拟CPU)。
使用的算法说明:
串行收集器在年轻代使用的是拷贝算法,这个算法比较简单,在这里不作详述。而年老代和持久代使用标记-清扫-压缩(mark-sweep-compact)算法。标记阶段,收集器识别哪些对象仍然活着。清扫阶段“扫荡”整个代,识别垃圾。以后,收集器执行平移压缩(sliding compaction),将存活的对象平移到代的前端(持久代相似),相应的在尾部留下一整块连续的空闲空间。压缩后,之后的分配就能够在年老代和持久代使用空闲指针(bump-the-pointer)技术。这种压缩算法可以在堆上迅速分配内存块。
示例:大多数客户端式(client-style machines)机器上运行的应用程序一般都是选择串行收集器,这些应用对短暂停没有要求。它之因此叫这个名字,是由于它能充分利用单个虚拟处理器进行垃圾回收的工做。在今天的硬件上,串行收集器能够有效的管理许多拥有几百M堆内存的重要应用程序,而且拥有相对短的最坏暂停(Full GC仅有几秒左右)。
在有大量JVM运行在同一个机器上(在某些状况下,JVM的个数比能够用的处理器的个数多)的应用环境下,串行垃圾收集器也被普遍使用。在这种环境下,要进行垃圾回收的JVM最好使用一个处理器,虽然这样会使垃圾回收的时间变得更长,但能够下降与其余JVM的冲突。这时,使用串行垃圾回收器可以得到很好的权衡。最后,若是在较小的内存和较少的CPU核心上对硬件进行稍加扩充,将能得到更好的性能。
命令行参数:
使用串行垃圾回收器 -XX:+UseSerialGC
给事例应用使用串行垃圾回收器的命令行以下:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseSerialGC -jar
c:\javademos\demo\jfc\Java2D\Java2demo.jar
并行垃圾收集器在年轻代使用多线程进行垃圾回收。默认状况下,在N个CPU的主机上,并行垃圾收集器使用N个垃圾收集器线程进行垃圾回收。垃圾收集器线程的个数能够在命令行进行设置:-XX:ParallelGCThreads=<指望的数值>
在单核的CPU上,尽管咱们请求设置的是并行垃圾收集器,但JVM仍是使用默认的垃圾收集器。在两个CPU的主机上,并行垃圾收集器与默认的串行垃圾收集器所表现出来的性能至关,年轻代的垃圾收集器暂停时间与两个以上CPU的主机相比也有所减小。并行垃圾收集器有两种使用方式。
使用的算法说明:
年轻代:与串行垃圾收集器年轻代相同的拷贝算法,只不过是该算法的并行版本,使用多个CPU并行的运行,减小了垃圾收集的开销,所以增长了吞吐量。
年老代:与串行垃圾收集器老年代想听的标记-清扫-压缩(mark-sweepcompact)算法,只不过是该算法的并行版本。
示例:并行收集器也叫作吞吐量收集器,由于其可使用多个CPU来增大应用程序的吞吐量。当应用程序须要处理大量的工做同事能够接受较长的暂停时,可使用并行垃圾收集器。例如,想打印报告或者帐单这样的批处理,或者进行大量的数据库查询。
-XX:+UseParallelGC
使用这个命令行参数,就会将年轻代设置为多线程的收集器,老年代使用单线程的收集器。该选项,还会在老年代进行单线程的压缩工做。
启动示例应用程序Java2Demo的命令行以下:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseParallelGC -jar
c:\javademos\demo\jfc\Java2D\Java2demo.jar
-XX:+UseParallelOldGC
使用该参数,年轻代和老年代都会使用多线程的收集器,同时,也使用多线程的压缩收集器。HotSpot仅仅在老年代进行整理,在年轻代是一个复制收集器,所以不必进行整理。
压缩描述的是这样一种行为,移动对象使得个对象之间没有空闲位置。再一次垃圾收集的清理以后,存活对象在内存中的存储位置之间可能存在空闲区。整理移动对象,使得对象的存储都是顺序的,彼此之间没有空闲区。垃圾收集器可能也是一个不带压缩的收集器。因此,并行收集器和并行压缩收集器之间的区别就是后者在垃圾收集清理操做以后,对内存空间进行一次整理。
启动示例应用程序Java2Demo的命令行以下:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseParallelOldGC -jar
c:\javademos\demo\jfc\Java2D\Java2demo.jar
并发标记清理收集器(CMS,又叫做并发低暂停收集器)在老年代进行收集。因为垃圾收集能使用应用线程的并发进行大多数的垃圾收集工做,因此它下降了应用程序的暂停时间。
正常说来,并发低暂停的收集器对存活对象不进行复制和压缩的工做。这种状况下,垃圾收集器没有移动任何存活对象。若是所以而带来了内存的碎片问题,那就为其分配一个更大的堆。
注意:CMS收集器在年轻代使用和并行收集器同样的算法。
示例:CMS收集器经常应用于须要低暂停及能够与垃圾收集器共享资源的场景。例如:桌面UI应用程序对事件的响应,Web服务器对请求的响应,以及数据库对查询请求的响应。
命令行参数:
若是要使用CMS收集器,使用 -XX:+UseConcMarkSweepGC ,同时,能够设置并发的线程数目 -XX:ParallelCMSThreads=<n> 。
启动示例应用程序Java2Demo的命令行以下:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseConcMarkSweepGC -XX:ParallelCMSThreads=2 -jar c:\javademos\demo\jfc\Java2D\Java2demo.jar
在Java 7中可使用G1垃圾回收器,它设计的初衷是用于长期取代CMS收集器。G1垃圾收集器是一个并行、并发,同时也是基于增量整理的低暂停垃圾收集器。与前面所描述的垃圾收集器相比,从布局方面与它们有很大的不一样。但本文不对该部分作详细的说明,有兴趣能够参考具体的文献资料。
命令行参数:
若是要使用CMS收集器,使用 -XX:+UseG1GC
启动示例应用程序Java2Demo的命令行以下:
java -Xmx12m -Xms3m -XX:+UseG1GC -jar c:\javademos\demo\jfc\Java2D\Java2demo.jar
本文对Java中的JVM进行了较为详细的介绍。咱们知道了堆和垃圾收集器在Java JVM中是很是重要的部分。自动的垃圾收集是经过分代垃圾收集的方法来完成的。一旦咱们知道了这一原理,咱们就能够经过Visual VM虚拟机工具来观察整个过程。