告诉你如何回答"线上CPU100%排查"面试问题

引言

不知道在你们面试中,有没有遇到这个问题:java

生产服务器上部署了几个java程序,忽然出现了CPU100%的异常告警,你如何定位出问题呢?linux

这个问题分为两版回答!
高调版
对不起,我是作研发的,这个问题在生产上是不可能碰见的!由于研发是不可能直接操做生产服务器,若是贵公司能出现这个问题,应该要反思一下本身的权限控制是否合理!面试

面试官内心活动:装13是否是,赶忙走!windows

低调版
这个问题我在生产上没碰到过,由于咱们是无法直接操做生产环境的。只能说,在测试环境曾经碰见过。操做步骤以下,balabala…服务器

面试官内心活动:权限控制的不错,应该是在大厂呆过。工具

 

Linux上执行过程:测试

一、top -c     【显示进程运行信息列表。按下P,进程按照cpu使用率排序。发现PID为3033的进程耗费cpu最高】
二、top -Hp 3033【显示一个进程的线程运行信息列表。按下P,进程按照cpu使用率排序。发现PID为3034的线程耗费cpu最高,printf %x 3034,将3034转成十六进制为0xbda】
三、jstack -l 3033 > ./3033.stack【执行命令,导出进程快照】
四、cat 3033.stack |grep 'bda' -C 8【执行grep命令,看线程0xbda作了什么】spa

 

下面开始咱们的正文线程

正文

下面给出两种系统下的排查步骤,都是如出一辙的,只是命令稍有区别!code

  • 查消耗cpu最高的进程PID

  • 根据PID查出消耗cpu最高的线程号

  • 根据线程号查出对应的java线程,进行处理。

准备一行死循环代码:

怎么跑,应该不用我说了,直接教你们怎么查!

windows版

可能有人有疑问,我为何要说windows版的!由于,我曾经给不少政府部门作过系统。我发现他们用的是windows server,不是linux系统。全部必要说一下!

查消耗cpu最高的进程PID

手边没有windows server机器,我以win 10为例,截图给你们看一下,先调出PID显示项!


而后发现进程PID以下图所示,为10856


接下来呢?

根据PID查出消耗cpu最高的线程号

这里用到微软的工具Process Explorer v16.22,地址以下
https://docs.microsoft.com/zh-cn/sysinternals/downloads/process-explorer
如图所示


发现最耗cpu的线程的TId为6616
这是十进制的数据,转成十六进制为19d8

根据线程号查出对应的java线程,进行处理

执行命令,导出进程快照

jstack -l 10856 > c:/10856.stack

打开文件 c:/10856.stack,搜索19d8,以下图所示


根据文件就能够看出,咱们的TestFor.java文件第七行一直在跑,至此定位到问题

Linux版

Linux版本,步骤是如出一辙的,就是命令换了一下

查消耗cpu最高的进程PID

执行命令

  • 执行top -c ,显示进程运行信息列表。按下P,进程按照cpu使用率排序

以下图所示,PID为3033的进程耗费cpu最高

根据PID查出消耗cpu最高的线程号

执行命令

  • top -Hp 3033 ,显示一个进程的线程运行信息列表。按下P,进程按照cpu使用率排序

以下图所示,PID为3034的线程耗费cpu最高

这是十进制的数据,转成十六进制为0xbda

根据线程号查出对应的java线程,进行处理

执行命令,导出进程快照

jstack -l 3033 > ./3033.stack

而后执行,grep命令,看线程0xbda作了什么

cat 3033.stack |grep 'bda' -C 8

输出以下

至此定位到问题

总结

你们记得必定要去实际操做一次!

相关文章
相关标签/搜索