为了解决性能问题,你登入了一台Linux服务器,在最开始的一分钟内须要查看什么?css
在Netflix咱们有一个庞大的EC2 Linux集群,还有很是多的性能分析工具来监控和调查它的性能。其中包括用于云监控的Atlas,用于实例按需分析的Vector。即便这些工具帮助咱们解决了大多数问题,咱们有时仍是得登入Linux实例,运行一些标准的Linux性能工具来解决问题。html
在这篇文章里,Netflix Performance Engineering团队将使用居家常备的Linux标准命令行工具,演示在性能调查最开始的60秒里要干的事,java
运行下面10个命令,你能够在60秒内就对系统资源的使用状况和进程的运行情况有大致上的了解。无非是先查看错误信息和饱和指标,再看下资源的使用量。这里“饱和”的意思是,某项资源供不该求,已经形成了请求队列的堆积,或者延长了等待时间。linux
uptime dmesg | tail vmstat 1 mpstat -P ALL 1 pidstat 1 iostat -xz 1 free -m sar -n DEV 1 sar -n TCP,ETCP 1 top
有些命令须要你安装sysstat
包。(译注:指mpstat, pidstat, iostat和sar,用包管理器直接安装sysstat便可) 这些命令所提供的指标可以帮助你实践USE方法:这是一种用于定位性能瓶颈的方法论。你能够以此检查全部资源(CPU,内存,硬盘,等等)的使用量,是否饱和,以及是否存在错误。同时请留意上一次检查正常的时刻,这将帮助你减小待分析的对象,并指明调查的方向。(译注:USE方法,就是检查每一项资源的使用量(utilization)、饱和(saturation)、错误(error))ios
接下来的章节里咱们将结合实际例子讲解这些命令。若是你想了解更多的相关信息,请查看它们的man page。git
$ uptime 23:51:26 up 21:31, 1 user, load average: 30.02, 26.43, 19.02
这个命令显示了要运行的任务(进程)数,经过它可以快速了解系统的平均负载。在Linux上,这些数值既包括正在或准备运行在CPU上的进程,也包括阻塞在uninterruptible I/O(一般是磁盘I/O)上的进程。它展现了资源负载(或需求)的大体状况,不过进一步的解读还有待其它工具的协助。对它的具体数值不用太较真。github
最右的三个数值分别是1分钟、5分钟、15分钟系统负载的移动平均值。它们共同展示了负载随时间变更的状况。举个例子,假设你被要求去检查一个出了问题的服务器,而它最近1分钟的负载远远低于15分钟的负载,那么你极可能已经扑了个空。sql
在上面的例子中,负载均值最近呈上升态势,其中1分钟值高达30,而15分钟值仅有19。这种现象有许多种解释,颇有多是对CPU的争用;该系列的第3个和第4个命令——vmstat
和mpstat
——能够帮助咱们进一步肯定问题所在。docker
$ dmesg | tail [1880957.563150] perl invoked oom-killer: gfp_mask=0x280da, order=0, oom_score_adj=0 [...] [1880957.563400] Out of memory: Kill process 18694 (perl) score 246 or sacrifice child [1880957.563408] Killed process 18694 (perl) total-vm:1972392kB, anon-rss:1953348kB, file-rss:0kB [2320864.954447] TCP: Possible SYN flooding on port 7001. Dropping request. Check SNMP counters.
这个命令显示了最新的10个系统信息,若是有的话。注意会致使性能问题的错误信息。上面的例子里就包括对过多占用内存的某进程的死刑判决,还有丢弃TCP请求的公告。apache
不要漏了这一步!检查dmesg
老是值得的。
$ vmstat 1 procs ---------memory---------- ---swap-- -----io---- -system-- ------cpu----- r b swpd free buff cache si so bi bo in cs us sy id wa st 34 0 0 200889792 73708 591828 0 0 0 5 6 10 96 1 3 0 0 32 0 0 200889920 73708 591860 0 0 0 592 13284 4282 98 1 1 0 0 32 0 0 200890112 73708 591860 0 0 0 0 9501 2154 99 1 0 0 0 32 0 0 200889568 73712 591856 0 0 0 48 11900 2459 99 0 0 0 0 32 0 0 200890208 73712