arthas使用介绍

时间 2019-12-09

标签 arthas 使用介绍繁體版

原文原文链接

背景：

一次线上问题的综合排查排查，两个相同的系统的某个模块，数据量更少的系统查询更慢。
先说下总体思路：java

查看系统整理负载，网络有100左右毫秒的延迟，看起来影响不大
查看正序运行总体状况，一次查询会经历3次FGC，有问题，解决后虽然会快一些可是仍是有点慢
跟踪调用栈，发现有点在获查询结果的时候特别慢
排查是否有mysql慢查询(定义为1秒以上的查询)，结果是没有
经过arthas发现调用了20屡次查询，每次网络延迟100ms，加起来就有2s了，定位出问题。

这样看起来arthas真的很强大，它不只仅能处理上述问题，还能....mysql

这个类从哪一个 jar 包加载的？为何会报各类类相关的 Exception？
我改的代码为何没有执行到？难道是我没 commit？分支搞错了？
遇到问题没法在线上 debug，难道只能经过加日志再从新发布吗？
线上遇到某个用户的数据处理有问题，但线上一样没法 debug，线下没法重现！
是否有一个全局视角来查看系统的运行情况？
有什么办法能够监控到JVM的实时运行状态？
代码出现异常，怎么能获取请求参数和返回值。

Arthas究竟是什么

Arthas 是Alibaba开源的Java诊断工具，采用命令行交互模式，提供了丰富的功能，是排查jvm相关问题的利器。
在逛github时，发现了这款利器，深刻了解以后，简直惊为天人。下面先列举一下它能作的一些事情：git

提供性能看板，包括线程、cpu、内存等信息，而且会定时的刷新。
根据各类条件查看线程快照。好比找出cpu占用率最高的n个线程等
输出jvm的各类信息，如gc算法、jdk版本、ClassPath等
查看/设置sysprop和sysenv
查看某个类的静态属性，也能够经过ognl语法执行一些语句
查看已加载的类的详细信息，好比这个类从哪一个jar包加载的。也能够查看类的方法的信息
dump某个类的字节码到指定目录
直接反编译指定的类
查看类加载器的一些信息
可让jvm从新加载某个类
监控方法的执行，同时能够获取到执行的入参、出参以及抛出的异常
追踪方法执行的调用栈，以及各个方法的调用时间

Arthas运行原理

Arthas命令列表

athas的各个命令

sc 和 sm

经过sc能够查看已加载类的相关信息，好比该类是从哪一个jar包加载的，被哪一个类加载器加载的，以及是不是接口等等。
sm查看已加载类的方法详情。

dashboard

进入当前系统的实时数据面板，按 ctrl+c 退出。这个面板会实时刷新，其中包括线程信息、内存信息、gc信息、还有一些运行时的数据。
另外，当运行在Ali-tomcat时，会显示当前tomcat的实时信息，如HTTP请求的qps, rt, 错误数, 线程池信息等等。github

thread

经过thread命令能够查看当前jvm进程的线程详情。能够查看线程的cpu使用时间占比，经过指定各类参数能够找出最忙的几个线程，以及阻塞其余线程的线程。具体如何使用这里很少作介绍，你们能够去看arthas的官方文档。正则表达式

当前最忙的前N个线程并打印堆栈
thread -i 5000 
thread -i 5000

jvm

经过jvm命令直接输出当前jvm的各类信息。算法

getstatic

经过getstatic命令能够方便的查看类的静态属性。sql

getstatic demo.MahtGame random

sysprop和sysenv

经过sysprop能够查看全部的系统变量，也能够设置某个系统变量。
同理，经过sysenv能够查看全部的操做系统环境变量，也能够查看设置某个环境变量。

ognl

执行ognl表达式，可执行任意代码express

Ognl @demo.MathGame@random

动态修改日志级别apache

经过ognl获取对应类上的logger对象实现类
sc命令来查看具体从哪一个jar包里加载的，sc -d org.apache.log4j.Logger
经过ognl修改日志级别

更详细的介绍：https://github.com/alibaba/arthas/issues/11vim

dump

将已加载类的字节码dump到本地磁盘上。

jad

有时咱们常常会不肯定线上或者测试环境的包是不是咱们修改过的，这时候就能够经过jad反编译来看下。

反编译指定已加载类的源码，jad demo.MathGame

classloader

将 JVM 中全部的classloader的信息统计出来，并能够展现继承树，urls等。

redafine

该命令能够加载外部的.class文件，而后覆盖 jvm已加载的类。注意，这个命令不必定都能覆盖成功，若是添加了新的field，就不会加载成功。

关于redefine，arthas的github上有个很是经典的userCase：

https://github.com/alibaba/arthas/issues/263

动态更新代码，不用重启jvm

watch

让你能方便的观察到指定方法的调用状况。能观察到的范围为：返回值、抛出异常、入参，经过编写 OGNL 表达式进行对应变量的查看。
watch的使用姿式比较丰富，能够在四个不一样的场景观察方法的执行。好比方法调用以前、方法调用以后、方法异常以后、方法结束以后。默认观察的是方法结束以后。
若是观察的是方法结束以后的场景，因为入参可能在执行方法时被改变，因此此时输出的可能不是真正的入参。所以，要看真正的入参，要看方法调用以前的，也就是加上-b的参数。
另外，使用-b参数观察的话，则观察不到方法返回的结果以及抛出的异常了。

参数名称	参数说明
class-pattern	类名表达式匹配
method-pattern	方法名表达式匹配
express	观察表达式
condition-express	条件表达式
[b]	在方法调用以前观察
[e]	在方法异常以后观察
[s]	在方法返回以后观察
[f]	在方法结束以后(正常返回和异常返回)观察
[E]	开启正则表达式匹配，默认为通配符匹配
[x:]	指定输出结果的属性遍历深度，默认为 1
[n:]	只执行n次，默认会不断输出，除非用户按下cltr+c

# 观察CommonTest的test方法
# 输出 入参、返回结果、抛出的异常 —— 输出的内容能够动态调整
# 后面跟着的是 条件表达式，表示耗时超过10ms才输出
# -n 表示只执行一次，-x表示 入参和返回结果的展开层次为5层
watch *.CommonTest test "{params,returnObj,throwExp}" '#cost>10' -x 5 -n 1

# 耗时大于10ms而且第一个参数等于1才输出
watch *.CommonTest test "{params,returnObj,throwExp}" '#cost>10 && params[0]==1' -x 5 -n 1
# 第一个参数大于1 而且第二个参数等于hello才输出
watch *.CommonTest test "{params,returnObj,throwExp}" 'params[0]>1 && params[1]=="hello"' -x 5 -n 1
# 第一个参数小于5或者第二个参数等于"world"就输出
watch *.CommonTest test "{params,returnObj,throwExp}" 'params[0]<5 || params[1]=="wolrd"' -x 5 -n 1
# 第一个参数的name字段等于world时才输出。
# 因为在方法执行过程当中参数的name属性可能发生改变，所以加上-b才能观察到真正的入参
watch -b *.CommonTest test "{params,returnObj,throwExp}" 'params[0].name=="wolrd"' -x 5 -n 1

# 因为同时指定了-s和-b，因此方法被调用一次，就会输出2次结果(两个场景分开输出)，分别是方法被调用前，和返回以后
# 注意，这里若是-n只设置成1，那么只会输出-b对应的输出,-s对应的输出因为没有次数了就没法输出了
watch *.CommonTest test '{params,returnObj,throwExp}' -x 5 -n 2 -s -b

在填写条件表达式时要注意一点，条件表达式中的params默认都是获取的方法执行完后的参数信息，好比入参a的属性name方法执行前是"hello",在方法执行后变成了"world",那么条件表达式传入'params[0].name="hello"'将不会输出，只有填入'params[0].name="hello"'才能够匹配上。这点对于后面的trace、stack命令也是同样的。

查看方法输入参数/返回值/异常信息，watch demo.MathGame primeFactors "{params,returnObj}" -x 2

monitor

monitor命令能够监控方法的执行状况。好比调用成功次数，失败次数，失败率、平均执行时间等等。默认120秒输出一次，也就是说，当咱们输入monitor命令以后，每120秒就会输出一次统计结果。

经过-c参数能够修改输出频率，支持通配符和正则表达式。
monitor -c 5 demo.MathGame primeFactors

trace

方法内部调用路径，并输出方法路径上的每一个节点上耗时，tt命令会记录每次方法调用的各类信息。它和watch有些类似可是它能记录下各个时间点的调用信息，以后随时查看，甚至replay此次调用。

trace demo.MathGame run

tt

timetunnel,记录下指定方法每次调用的入参和返回信息，并能对这些不一样的时间下调用进行观测,同时可回放该方法调用
tt -t demo.MathGame primeFactors

直接重放请求参数

1.使用tt –t 类名次 方法名次
2.tt –play -i 1000

另外介绍几个我常常用的工具，jmap,jstat,jstack,dump这些基本的就不介绍了。

Tprofiler

TProfiler是一个能够在生产环境长期使用的性能分析工具.它同时支持剖析和采样两种方式,记录方法执行的时间和次数,生成方法热点对象建立热点线程状态分析等数据,为查找系统性能瓶颈提供数据支持.

TProfiler在JVM启动时把时间采集程序注入到字节码中,整个过程无需修改应用源码.运行时会把数据写到日志文件,通常状况下每小时输出的日志小于50M.

show-busy-java-threads

查找cpu性能消耗过程
top命令找出消耗CPU高的Java进程及其线程id：
开启线程显示模式（top -H，或是打开top后按H）
按CPU使用率排序（top缺省是按CPU使用降序，已经合要求；打开top后按P能够显式指定按CPU使用降序）
记下Java进程id及其CPU高的线程id
查看消耗CPU高的线程栈：
用进程id做为参数，jstack出有问题的Java进程
手动转换线程id成十六进制（能够用printf %x 1234）
在jstack输出中查找十六进制的线程id（能够用vim的查找功能/0x1234，或是grep 0x1234 -A 20）
查看对应的线程栈，分析问题
查问题时，会要屡次上面的操做以分析肯定问题，这个过程太繁琐太慢了。

参考：https://blog.csdn.net/u013332124/article/details/84888074#11_redefine_157

1. arthas-boot 使用
2. arthas使用
3. Arthas的使用
4. Arthas使用
5. Arthas使用指南
6. arthas使用分享
7. SIPP介绍以及使用介绍
8. WebSocketd使用介绍
9. com.alibaba.fastjson使用介绍
10. OKHttpUtils使用介绍
更多相关文章...
• 网站主机介绍 - 网站主机教程
• TortoiseSVN 使用教程 - SVN 教程
• Java Agent入门实战（一）-Instrumentation介绍与使用
• Composer 安装与使用