JAVA进程CPU使用率使用太高故障排查

时间 2019-11-11

标签 java 进程 cpu 使用太高故障排查栏目 Java 繁體版

原文原文链接

临近月底，用户量上来，发现业务进程频繁从Eureka上掉下来，观察后发现掉下来前进程CPU一直占用比较高。

按《Java进程CPU使用率高排查》方法查看堆栈信息，发现有个方法很可疑，发给开发人员查看，以为表数据量太大，查询没有走索引，新建索引后，感受状况有好转。

排查步骤以下：

1.使用top 定位到占用CPU高的进程PID

top

2.获取线程信息，并找到占用CPU高的线程

ps -mp pid -o THREAD,tid,time | sort -rn

3.将须要的线程ID转换为16进制格式

printf "%x\n" tid

4.打印线程的堆栈信息

jstack pid |grep tid -A 30

同时发现数据库链接有报“Connection reset”的异常，一时也发现不了问题，将dbcp2链接池换成durid。

经过durid的spring监控发现（果然很是强大），仍是一样的方法读取行数很是大。

发现《记一次线上Java程序致使服务器CPU占用率太高的问题排除过程》问题状况很是类似，由于在以前用jstack查看时，就是GC占用CPU很是高。

再仔细看代码，发现某种状况下，确实会读取全量表数据。

优化代码后，问题解决。