性能诊断是软件工程师在平常工做中须要常常面对和解决的问题,在用户体验至上的今天,解决好应用的性能问题能带来很是大的收益。Java 做为最流行的编程语言之一,其应用性能诊断一直受到业界普遍关注。可能形成 Java 应用出现性能问题的因素很是多,例如线程控制、磁盘读写、数据库访问、网络I/O、垃圾收集等。想要了定位这些问题,一款优秀的性能诊断工具必不可少。本文将介绍 Java 性能诊断过程当中的经常使用工具,并重点介绍其中的优秀表明 JProfiler 的基本原理和最佳实践(本文所作的调研基于jprofiler10.1.4
)。html
在 Java 的世界里,有许多诊断工具可供选择,既包括像 jmap、jstat 这样的简单命令行工具,又包括 JVisualvm、JProfiler 等图形化综合诊断工具,同时还有 SkyWalking、ARMS 这样的针对分布式应用的性能监控系统。下面分别对其进行介绍。java
JDK 内置了许多命令行工具,它们可用来获取目标 JVM 不一样方面、不一样层次的信息。git
使用上述命令行工具或组合能帮您获取目标 Java 应用性能相关的基础信息,但它们存在下列局限:github
下面介绍几款图形化的综合性能诊断工具。数据库
JVisualvmapache
JVisualvm 是 JDK 内置的可视化性能诊断工具,它经过 JMX、jstatd、Attach API 等方式获取目标 JVM 的分析数据,包括 CPU 使用率、内存使用量、线程堆栈信息等。此外,它还能直观地展现 Java 堆中各对象的数量和大小、各 Java 方法的调用次数和执行时间等。编程
JProfiler缓存
JProfiler 是由 ej-technologies 公司开发的一款 Java 应用性能诊断工具。它聚焦于四个重要主题上。性能优化
若是只须要诊断单机 Java 应用的性能瓶颈,上面介绍的诊断工具就已经够用了。但随着现代系统架构逐渐从单体转变为分布式、微服务,单纯使用上述工具每每没法知足需求,这时就须要借助 Jaeger、ARMS、SkyWalking 这些分布式追踪系统提供的全链路追踪功能。分布式追踪系统种类繁多,但实现原理都大同小异,它们经过代码埋点的方式记录 tracing 信息,经过 SDK 或 agent 将记录的数据传输至中央处理系统,最后提供 query 接口对结果进行展现和分析,想了解更多分布式追踪系统的原理可参考文章开放分布式追踪(OpenTracing)入门与 Jaeger 实现。网络
JProfiler 包含用于采集目标 JVM 分析数据的 JProfiler agent、用于可视化分析数据的 JProfiler UI、提供各类功能的命令行工具,它们之间的关系以下图所示。
JProfiler agent
JProfiler agent 是一个本地库,它能够在 JVM 启动时经过参数-agentpath:<path to native library>
进行加载或者在程序运行时经过 JVM Attach 机制进行加载。Agent 被成功加载后,会设置 JVMTI 环境,监听虚拟机产生的事件,如类加载、线程建立等。例如,当它监听到类加载事件后,会给这些类注入用于执行度量操做的字节码。
JProfiler UI
JProfiler UI 是一个可独立部署的组件,它经过 socket 和 agent 创建链接。这意味着不论目标 JVM 运行在本地仍是远端,JProfiler UI 和 agent 间的通讯机制都是同样的。
JProfiler UI 的主要功能是展现经过 agent 采集上来的分析数据,此外还能够经过它控制 agent 的采集行为,将快照保存至磁盘,展现保存的快照。
命令行工具
JProfiler 提供了一系列命令行工具以实现不一样的功能。
JProfiler 同时支持诊断本地和远程 Java 应用的性能。若是您须要实时采集并展现远程 JVM 的分析数据,须要完成以步骤:
具体步骤可参考文档 Installing JProfiler 和 Profiling A JVM。
本章将以高性能写 LogHub 类库 Aliyun LOG Java Producer 为原型,带您了解如何使用 JProfiler 剖析它的性能。若是您的应用或者您在使用 producer 的过程当中遇到了性能问题,也能够用相似的方式定位问题根因。若是您还不了解 producer 的功能,建议先阅读文章日志上云利器 - Aliyun LOG Java Producer。本章使用的样例代码参见 SamplePerformance.java。
数据采集模式
JProfier 提供两种数据采集模式 Sampling 和 Instrumentation。
因为咱们须要获取方法级别的统计信息,这里选择了 Instrumentation 模式。同时配置了 Filter,让 agent 只记录位于 Java 包com.aliyun.openservices.aliyun.log.producer
下的类和类com.aliyun.openservices.log.Client
的 CPU 分析数据。
应用启动模式
经过为 JProfiler agent 指定不一样的参数能够控制应用的启动模式。
-agentpath:<path to native library>=port=8849
。-agentpath:<path to native library>=port=8849,nowait
。-agentpath:<path to native library>=offline,id=xxx,config=/config.xml
。由于是在测试环境,同时对应用启动初期的性能也比较关注,这里选择了默认的等待模式。
在完成 JProfiler 的设置后,即可以对 Producer 的性能进行诊断。
Overview
在概览页咱们能够清晰的看到内存使用量、垃圾收集活动、类加载数量、线程个数和状态、CPU 使用率等指标随时间变化的趋势。
经过此图,咱们能够做出以下基本判断:
CPU views
CPU views 下的各个子视图展现了应用中各方法的执行次数、执行时间、调用关系等信息,能帮咱们定位对应用性能影响最大的方法。
Call Tree
Call tree 经过树形图清晰地展示了方法间的层次调用关系。同时,JProfiler 将子方法按照它们的执行总时间由大到小排序,这能让您快速定位关键方法。
对于 Producer 而言,方法SendProducerBatchTask.run()
耗时最多,继续向下查看会发现该方法的主要时间消耗在了执行方法Client.PutLogs()
上。
Hot Spots
若是您的应用方法不少,且不少子方法的执行时间比较接近,使用 hot spots 视图每每能助您更快地定位问题。该视图能根据方法的单独执行时间、总执行时间、平均执行时间、调用次数等属性对它们排序。其中,单独执行时间等于该方法的总执行时间减去全部子方法的总执行时间。
在该视图下,能够看到Client.PutLogs()
,LogGroup.toByteArray()
,SamplePerformance$1.run()
是单独执行时间耗时最多的三个方法。
Call Graph
找到了关键方法后,call graph 视图能为您呈现与该方法直接关联的全部方法。这有助于咱们对症下药,制定合适的性能优化策略。
这里,咱们观察到方法Client.PutLogs()
执行的主要时间花费在了对象序列化上,所以性能优化的关键是提供执行效率更高的序列化方法。
Live memory
Live memory 下的各个子视图能让您掌握内存的具体分配和使用状况,助您判断是否存在内存泄漏问题。
All Objects
All Objects 视图展现了当前堆中各类对象的数量和总大小。由图可知,程序在运行过程当中构造出了大量 LogContent 对象。
Allocation Call Tree
Allocation Call Tree 以树形图的形式展现了各方法分配的内存大小。能够看到,SamplePerformance$1.run()
和SendProducerBatchTask.run()
是内存分配大户。
Allocation Hot Spots
若是方法比较多,您还能够经过 Allocation Hot Spots 视图快速找出分配对象最多的方法。
Thread History
线程历史记录视图直观地展现了各线程在不一样时间点的状态。
不一样线程执行的任务不一样,所展示的状态特征也不一样。
pool-1-thread-<M>
会循环调用producer.send()
方法异步发送数据,它们在程序刚启动时一直处于运行状态,但随后在大部分时间里处于阻塞状态。这是由于 producer 发送数据的速率低于数据的产生速率,且单个 producer 实例能缓存的数据大小有限。在程序运行初始,producer 有足够空间缓存待发送数据,因此pool-1-thread-<M>
一直处于运行状态,这也就解释了为什么程序在刚启动时 CPU 使用率较高。随着时间的推移,producer 的缓存被逐渐耗尽,pool-1-thread-<M>
必须等到 producer “释放”出足够的空间才有机会继续运行,这也是为何咱们会观察到大量线程处于阻塞状态。aliyun-log-producer-0-mover
负责将超时 batch 投递到发送线程池中。因为发送速率较快,batch 会因缓存的数据达到了上限被pool-1-thread-<M>
直接投递到发送线程池中,所以 mover 线程在大部分时间里都处于等待状态。aliyun-log-producer-0-io-thread-<N>
做为真正执行数据发送任务的线程有一部分时间花在了网络 I/O 状态。aliyun-log-producer-0-success-batch-handler
用于处理发送成功的 batch。因为回调函数比较简单,执行时间短,它在大部分时间里都处于等待状态。aliyun-log-producer-0-failure-batch-handler
用于处理发送失败的 batch。因为没有数据发送失败,它一直处于等待状态。经过上述分析可知,这些线程的状态特征都是符合预期的。
Overhead Hot Spots Detected
当程序运行结束后,JProfiler 会弹出一个对话框展现那些频繁被调用,但执行时间又很短的方法。在下次诊断时,您可让 JProfiler agent 在分析过程当中忽略掉这些方法以减轻对应用性能的影响。
经过 JProfiler 的诊断可知应用不存在大的性能问题,也不存在内存泄漏。下一步的优化方向是提高对象的序列化效率。
本文为云栖社区原创内容,未经容许不得转载。