不知道在你们面试中,有没有遇到这个问题java
生产服务器上部署了几个java程序,忽然出现了CPU100%的异常告警,你如何定位出问题呢?linux
这个问题分为两版回答!
高调版
对不起,我是作研发的,这个问题在生产上是不可能碰见的!由于研发是不可能直接操做生产服务器,若是贵公司研发能遇到这个问题,应该要反思一下本身的权限控制是否合理!面试
面试官内心活动
:装13是否是,赶忙走!windows
低调版
这个问题我在生产上没碰到过,由于咱们是无法直接操做生产环境的。只能说,在测试环境曾经碰见过。操做步骤以下,balabala...服务器
面试官内心活动
:权限控制的不错,应该是在大厂呆过。dom
下面开始咱们的正文工具
下面给出两种系统环节下的排查步骤,都是如出一辙的,只是命令稍有区别!测试
准备一行死循环代码线程
public class TestFor { public static void main(String[] args) { int random = 0; while (random < 100) { random = random * 10; } } }
怎么跑,应该不用我说了,直接教你们怎么查!code
可能有人有疑问,我为何要说Windows
版的!由于,我曾经给不少政府部门作过系统。我发现他们用的是Windows Server
,不是Linux
系统。全部必要说一下!
手边没有Windows Server
机器,我以Win 10
为例,截图给你们看一下,先调出PID
显示项!
而后发现进程PID
以下图所示,为10856
接下来呢
这里用到微软的工具Process Explorer v16.22,地址以下
https://docs.microsoft.com/zh-cn/sysinternals/downloads/process-explorer
如图所示
发现最耗Cpu
的线程的TID
为6616
这是十进制的数据,转成十六进制为0x19d8
执行命令
jstack -l 10856 > c:/10856.stack
打开文件c:/10856.stack
,搜索19d8
,以下图所示
根据文件就能够看出,咱们的TestFor.java
文件第七行一直在跑,至此定位到问题
Linux版本,步骤是如出一辙的,就是命令换了一下
执行命令
top -c
,显示进程运行信息列表。按下P,进程按照Cpu使用率排序以下图所示,PID
为3033
的进程耗费Cpu
最高
执行命令
top -Hp 3033
,显示一个进程的线程运行信息列表。按下P,进程按照Cpu使用率排序以下图所示,PID
为3034
的线程耗费Cpu最高
这是十进制的数据,转成十六进制为0Xbda
jstack -l 3033 > ./3033.stack
而后执行,grep命令,看线程0xbda
作了什么
cat 3033.stack |grep 'bda' -C 8
输出以下
至此定位到问题
你们记得必定要去实际操做一次!