perf是linux系统中提供的性能分析工具,它基于一个叫“Performance counters”的内核子系统实现,同时支持硬件(CPU、PMU(Performance Monitoring Unit))和软件(软件计数器、tracepoint)层面的性能分析。java
perf与其余性能调优工具同样,都是经过对监测对象进行采样,根据采样点的分布来推断整个程序的行为。经过perf list命令咱们能够看到perf支持不少的采样事件,好比branch-misses、cpu-clock等等。perf中预约义的事件属于不一样的类型,好比硬件产生的事件(cache 命中/分支miss)和软件产生的事件(context switch/page fault)等等。linux
tracepoint是linux内核中定义的一些hook,若是被开启,它们就会在执行到特定逻辑时被触发,方便其余工具获取系统内部的运行状态等信息,perf就是利用了tracepoint,它会记录和统计tracepoint的各个事件,生成分析报告。bash
perf 工具的具体使用方式以下:app
perf [--version] [--help] COMMAND [ARGS]
复制代码
其中的COMMAND列表能够经过执行perf --help查看,下面列举几个经常使用的command。函数
perf stat的做用是执行一个命令并收集其运行过程当中的各个数据,它能够提供一个程序运行状况的整体概览。好比:工具
user@localhost:~$ perf stat hostname
localhost
Performance counter stats for 'hostname':
0.313464 task-clock (msec) # 0.481 CPUs utilized
2 context-switches # 0.006 M/sec
0 cpu-migrations # 0.000 K/sec
153 page-faults # 0.488 M/sec
896,723 cycles # 2.861 GHz
620,709 instructions # 0.69 insn per cycle
121,143 branches # 386.465 M/sec
6,247 branch-misses # 5.16% of all branches
0.000651441 seconds time elapsed
复制代码
上面这个例子,经过perf stat运行了hostname命令,并将其运行过程当中的一些指标汇总显示了出来,好比task-clock、context-switches等待。默认状况下,perf stat 会输出几个经常使用的事件的统计,好比:性能
除此以外,咱们可使用-e参数来指定咱们感兴趣的事件,好比:ui
user@localhost:~$ perf stat -e cache-misses hostname
localhost
Performance counter stats for 'hostname':
682 cache-misses
0.000646676 seconds time elapsed
复制代码
perf top的做用是实时地显示系统当前的性能统计信息。前面的perf stat用于对一个特定的程序进行分析,而某些时候咱们可能并不知道是哪一个程序影响了系统性能,这时候就能够用perf top来查找可疑的程序。好比:spa
Samples: 775 of event 'cpu-clock', Event count (approx.): 92931021
Overhead Shared Object Symbol
8.93% [kernel] [k] vsnprintf
7.73% perf [.] rb_next
5.92% [kernel] [k] kallsyms_expand_symbol.clone.0
5.07% [kernel] [k] format_decode
4.59% [kernel] [k] number
3.40% perf [.] symbols__insert
3.03% libslang.so.2.2.1 [.] SLtt_smart_puts
复制代码
上面的例子显示perf统计了cpu-clock事件的数据,根据比例进行了排序。和perf stat同样,咱们能够经过-e参数指定统计其余的事件,好比perf top -e context-switches能够查看进程切换最多的top N个进程。code
perf record的做用和perf stat相似,它能够运行一个命令并生成统计信息,不过perf record不会将结果显示出来,而是将结果输出到文件中。perf record生成的文件能够用perf report来进行解析。
perf record还能够经过-g参数,在分析时生成calling graph,帮助定位更上层的逻辑分布。
经过例子咱们能够发现,perf的分析结果中的Symbol一列显示的都是c语言函数的名字。对于java来讲,jit编译产生的函数就会直接显示在symbol里,而不是java的函数名,这时要定位问题就不是那么容易了,咱们须要经过额外的手段将symbol和java程序的符号表对应起来,具体后续再讨论了。