原文连接:http://www.cubrid.org/blog/dev-platform/how-to-monitor-java-garbage-collection/java
这是GC专家系列文章的第二篇。在第一篇理解Java垃圾回收中咱们学习了几种不一样的GC算法的处理过程,GC的工做方式,新生代与老年代的区别。到目前为止,你应该已经了解了JDK 7中的5种GC类型,以及每种GC对性能的影响。算法
在本篇中,我将介绍JVM在真实环境中如何运行GC的。segmentfault
GC监控 指的是在运行时跟踪JVM运行GC的过程。例如,经过GC监控,咱们能找出:网络
什么时候新生代的对象会被移动到老年代,有多少对象被移到了老年代。工具
什么时候stop-the-world发生以及持续时间。性能
经过GC监控,能发现JVM是否在有效的运行GC以及是否须要额外的GC调优。基于这些信息,咱们能够经过优化应用或者改变GC运行方式(GC调优),从而提升应用性能。学习
GC监控的方式不少,区别在于GC操做信息的展现会有所不一样。GC是由JVM触发,由于GC监控工具展现的信息都是由JVM提供,因此无论使用哪一种方式作GC监控,最终获取的信息都是一致的。所以,没有必要深刻学习每种GC监控工具,只须要花些时间学习每种工具的使用方法,可以在不一样的场合选择合适的工具便可。优化
由于JVM规范没有要求暴露GC信息的标准方法,因此下面列出的工具或JVM选项并不能适用于全部不一样的JVM实现。在下面的介绍中都是基于Hotspot JVM(Oracle JVM)进行。由于NHN使用的是Oracle(Sun) JVM,因此在使用如下工具或JVM选项时并不会太困难。网站
首先,GC监控工具根据访问接口和方式不一样分为CUI和GUI。经典的CUI 工具可使用一个单独的CUI应用jstat,也能够在运行JVM时经过提供"-verbosegc"选项来实现。spa
GUI GC监控工具经过单独的GUI应用来实现,后面会介绍三个经常使用的GUI GC工具:jconsole, jvisualvm和Visual GC。
下面开始学习每一种GC监控方法:
jstat是Hotspot JVM内置的监控工具。Hotspot JVM还内置了其余监控工具如jps和jstatd。有时候须要这三种工具一块儿来监控Java应用的运行。
jstat 不仅提供GC操做的相关信息,也还提供类加载和即时编译器相关的操做信息。尽管如此,本文咱们只会涉及jstat提供的GC操做相关的功能。
jstat 位于$JDK_HOME/bin
目录,若是java或javac命令可以正常运行,jstat命令也应该可以运行。
你能够在命令行中尝试一下:
$> jstat –gc $<vmid$> 1000 S0C S1C S0U S1U EC EU OC OU PC PU YGC YGCT FGC FGCT GCT 3008.0 3072.0 0.0 1511.1 343360.0 46383.0 699072.0 283690.2 75392.0 41064.3 2540 18.454 4 1.133 19.588 3008.0 3072.0 0.0 1511.1 343360.0 47530.9 699072.0 283690.2 75392.0 41064.3 2540 18.454 4 1.133 19.588 3008.0 3072.0 0.0 1511.1 343360.0 47793.0 699072.0 283690.2 75392.0 41064.3 2540 18.454 4 1.133 19.588 $>
如上所示,真实的内存各部分数据状况按如下各列顺序列出:
SOC S1C S0U S1U EC EU OU PC
vmid(虚拟机id: Virtual Machine ID),见名示意,表示VM的ID。运行在本地或远程的虚拟机均可以经过vmid指定。运行在本地虚拟机上的Java应用的vmid又称为lvmid(Local vmid),一般与PID相同。虽然能够经过ps命令或Windows的任务管理器查看PID的值从而获得lvmid,但更推荐使用jps,由于PID和lvmid之间并不老是一一对应。jps表示Java PS。正如ps命令能够看到PIDs和进程名,经过jps能够看到vmids和main方法信息。
经过jps找到你要监控的Java应用的vmid,而后做为jstat的参数便可。若是多个WAS实例运行在同一设备上时,若是只使用jps命令只能找到引导程序的信息。这时候就要ps -ef | grep java
命令和jps命令一块儿使用。
GC性能数据须要持续观察,所以在运行jstat时须要定时输出GC的监控信息。
举例来讲:运行jstat -gc <vmid> 1000
(or 1s)将会每隔1s在控制台上输出一次GC数据。jstat -gc <vmid> 1000 10
将会每隔1s输出一次GC数据,总共输出10次。
与GC相关的选项除了-gc,还有其余一些,以下表所示:
选项名称 | 描述 |
---|---|
gc | 输出堆空间上各分区当前的大小及使用量(Ede, Survivor, Old等),GC执行的总次数以及累积消耗的执行时长。 |
gccapacity | 输出堆空间上各分区的最小和最大容量,当前大小,每一个区上的GC执行次数(不输出当前使用量和累积的GC耗时)。 |
gccause | 除了输出 -gcutil提供的信息外,还会输出最后一次GC和当前GC的缘由。 |
gcnew | 新生代上的GC性能数据。 |
gcnewcapacity | 新生代容量的统计信息。 |
gcold | 老年代的GC性能数据。 |
gcoldcapacity | 老年代容量的统计信息。 |
gcpermcapacity | 持久代(方法区)上的统计信息。 |
gcutil | 以%的格式输出每一个分区的使用量。同时也会输出GC执行的总次数及累积耗时。 |
若是只关心GC频率,一般使用-gcutil(或者 -gccause), -gc, -gccapacity便可。
-gcutil 用于检测各区上的使用量,GC执行次数以及累积耗时,
-gccapacity 和其余的几个选项可用于输出实际已分配的内存大小。
使用-gc选项的输出以下:
S0C S1C … GCT 1248.0 896.0 … 1.246 1248.0 896.0 … 1.246 … … … …
给jstat指定不一样的选项会列出不一样的列,以下列所示。表格右侧列出了会输出此信息的jstat选项。
数据列 | 描述 | 支持的jstat 选项 |
---|---|---|
S0C | Survivor0的当前容量 | -gc -gccapacity -gcnew -gcnewcapacity |
S1C | S1的当前容量 | -gc -gccapacity -gcnew -gcnewcapacity |
S0U | S0的使用量 | -gc -gcnew |
S1U | S1的使用量 | -gc -gcnew |
EC | Eden区的当前容量 | -gc -gccapacity -gcnew -gcnewcapacity |
EU | Eden区的使用量 | -gc -gcnew |
OC | old区的当前容量 | -gc -gccapacity -gcnew -gcnewcapacity |
OU | old区的使用量 | -gc -gcnew |
PC | 方法区的当前容量 | -gc -gccapacity -gcold -gcoldcapacity -gcpermcapacity |
PU | 方法区的使用量 | -gc -gcold |
YGC | Young GC次数 | -gc -gccapacity -gcnew -gcnewcapacity -gcold -gcoldcapacity -gcpermcapacity -gcutil -gccause |
YGCT | Young GC累积耗时 | -gc -gcnew -gcutil -gccause |
FGC | Full GC次数 | -gc -gccapacity -gcnew -gcnewcapacity -gcold -gcoldcapacity -gcpermcapacity -gcutil -gccause |
FGCT | Full GC累积耗时 | -gc -gcold -gcoldcapacity -gcpermcapacity -gcutil -gccause |
GCT | GC总的累积耗时 | -gc -gcold -gcoldcapacity -gccapacity -gcpermcapacity -gcutil -gccause |
NGCMN | 新生代最小容量 | -gccapacity -gcnewcapacity |
NGCMX | 新生代最大容量 | -gccapacity -gcnewcapacity |
NGC | 新生代当前容量 | -gccapacity -gcnewcapacity |
OGCMN | 老年代最小容量 | -gccapacity -gcoldcapacity |
OGCMX | 老年代最大容量 | -gccapacity -gcoldcapacity |
OGC | 老年代当前容量 | -gccapacity -gcoldcapacity |
PGCMN | 方法区最小容量 | -gccapacity -gcpermcapacity |
PGCMX | 方法区最大容量 | -gccapacity -gcpermcapacity |
PGC | 方法区当前容量 | -gccapacity -gcpermcapacity |
PC | 方法区的当前容量 | -gccapacity -gcpermcapacity |
PU | 方法区使用量 | -gccapacity -gcold |
LGCC | 上一次GC发生的缘由 | -gccause |
GCC | 当前GC发生的缘由 | -gccause |
TT | 存活阀值,若是对象在新生代移动次数超过此阀值,则会被移到老年代 | -gcnew |
MTT | 最大存活阀值,若是对象在新生代移动次数超过此阀值,则会被移到老年代 | -gcnew |
DSS | survivor区的理想容量 | -gcnew |
表格中容量数量单位为:KB
jstat的优势在于不论是本地仍是远程Java应用,你均可以经过jstat命令查看GC操做相关的数据,并经过控制台输出这些信息。在使用-gcutil选项时,会输出以下字段的信息。在作GC调优时,尤为要关注YGC, YGCT, FGC, FGCT和GCT的数据变化。
S0 S1 E O P YGC YGCT FGC FGCT GCT 0.00 66.44 54.12 10.58 86.63 217 0.928 2 0.067 0.995 0.00 66.44 54.12 10.58 86.63 217 0.928 2 0.067 0.995 0.00 66.44 54.12 10.58 86.63 217 0.928 2 0.067 0.995
这些信息很是重要,它统计了GC运行时的耗时状况,能反映出GC的性能指标。
在上例中,YGC是217次, YGCT为0.928,平均下来每次young GC耗时4ms(0.004 s)。一样可算出full GC的平均耗时为33ms。
然而平均值对发现实现的GC问题并无太大的帮助,由于每次GC耗时一般会有巨大的误差(也就是说,若是full GC的平均值为0.067s,可能意味着其中一次GC耗时1ms,而另一次持续134ms)。为了能观察每次GC的独立耗时而非平均值,更好的方式是使用-verbosegc。
-verbosegc 是运行Java应用时的一个JVM选项。jstat能够监控任何JVM应用而无需指定启动参数,-verbosegc去要在开启应用时就指定好,因此看起来-verbosegc并非一个必要的选项(由于可使用jstat完成相同工做)。然而当GC发生时-verbosegc的输出信息更容易理解,这对于监控烦杂的GC信息却大于益处。
jstat | -verbosegc | |
---|---|---|
监控目标 | 可输出日志到终端上的Java应用或者能经过jstatd链接到网络的远程Java应用 | 在启动JVM时指定了-verbosegc 参数的Java应用 |
输出信息 | 堆状态(使用量、最大容量、GC次数及累积耗时等) | 每次GC先后新生代和老年代的容量变化及GC耗时 |
输出时机 | 任何指定的时间 | 任何GC发生时 |
优点 | 方便连续观察堆大小的变化 | 观察单次GC对系统的影响 |
在使用-verbosegc时还可同时指定如下附加选项:
-XX:+PrintGCDetails
-XX:+PrintGCTimeStamps
-XX:+PrintHeapAtGC
-XX:+PrintGCDateStamps(JDK6U4引入的选项)
若是只是指定了-verbosegc选项,则默认会同时指定-XX:+PrintGCDetails。另外,-verbosegc的附加选项均可以组合使用。
使用-verbosegc后,当有minor GC发生时,输出的数据格式以下:
[GC [<collector>: <starting occupancy1> -> <ending occupancy1>, <pause time1> secs] <starting occupancy3> -> <ending occupancy3>, <pause time3> secs]
字段 | 含义 | |
---|---|---|
Collector | 使用的收集器 | |
starting occupancy1 | GC发生前的新生代大小 | |
ending occupancy1 | GC后新生代的大小 | |
pause time1 | 执行minor GC时Java应用停顿的时长 | |
starting occupancy3 | GC发生前堆空间总大小 | |
ending occupancy3 | GC发生后堆空间总大小 | |
pause time3 | 执行整体GC(包括Full GC)时Java应用停顿时长 |
下面是一个Full GC输出的例子:
[Full GC [Tenured: 3485K->4095K(4096K), 0.1745373 secs] 61244K->7418K(63104K), [Perm : 10756K->10756K(12288K)], 0.1762129 secs] [Times: user=0.19 sys=0.00, real=0.19 secs]
若是使用了[CMS回收算法](),CMS相关信息也会紧接着提供出来。
由于-verbosegc选项能够把每次GC发生时的信息都以log方式输出,因此很容易观察GC操做关后heap使用率的变化状况。
Java Virsual VM是Oracle JDK提供的一个GUI式的图表/监控工具。
图1:VirsualVM 界面
与内置在JDK中的版本不一样,你能够在网站上单独下载Virsual VM。方便起见,JDK内置的版本称为Java VirsualVM(jvisualvm),从网站上单独下载的称为Virsual VM(visualvm)。两者之间的特性并不彻底一致,在一些方面(例如安装插件等)会有细微的差异。就我我的而言,更偏向于使用单独下载的Virsual VM。
启动Visual VM后,若是你左侧面板上选择了但愿监控的应用,就会看到"Monitoring"一栏。从Monitoring栏中能够得到关于GC和内存堆的基本信息。
尽管能经过Visual VM的基本特性获得GC的基本状态,但并不能像使用jstat和-verbosegc同样得到更详细的信息。
若是想获得像jstat同样的详细信息,则须要安装相应的Virsual VM插件。能够在Tools菜单里获取Virsual GC插件。
图2:Virsual GC安装界面
经过Virsual GC,能够以更直观的方式得到jstatd提供的信息。
图3:Virsual GC运行界面
HPJMeter是一个分析-verbosegc输出结果的便捷工具。若是把Visual GC看做是jstat的GUI版本,那么HPJMeter则是-verbosegc的GUI版本。话说回来,GC分析只是HPJMeter提供的众多特性之一。HPJMeter是HP公司开发的一款性能监控工具,可使用在HP-UX,Linux和MS Windows上。
起初,只是一款叫作HPTune的工具提供GUI的方式分析-verbosegc。自从HPJMeter 3.0开始便集成了HPTune,所以无需再单独下载HPTune。
在应用运行过程当中,-verbosegc的输出结果能够重定向到一个单独的文件中。
能够经过HPJMeter打开该文件,而后使用直观的GUI界面便捷的分析GC数据。
图4:HPJMeter
本章做为GC调优的铺垫,着重于介绍了如何进行GC信息监控。通常状况我比较建议先使用jstat观察GC操做,当发现有比较耗时的GC后,再经过-verbosegc来分析GC数据。所以GC调优的通常过程就是分析和对比使用不一样GC选项后-verbosegc输出结果的变化。下章将会经过真实案例来介绍进行GC调优的最佳选项。
做者:Sangmin Lee, 性能实验室高级工程师,NHN公司