close wait 致使的java web容器假死

1.现象

线上tomcat或后台task java进程偶发性出现假死,彻底没有规律java

1.1 java环境
java -version

1.2 linux环境
// 查看操做系统版本信息
cat /proc/version

// 查看操做系统内核信息
uname -a

// 查看系统版本信息的命令
 lsb_release -a

2.分析步骤

2.1 查看进程存活状态
ps -ef | grep java

查询到该进程的ID是12635,监听的端口是10061,后面会用到linux

2.2 查看该端口的监听状况
// 查看该tomcat服务监听的端口,并将结果输出至日志文件
netstat -an | grep 10061 >> netstat-sku.log

// 查看前200行内容
head -n 200 netstat-sku.log

发现大量close wait,初步能够判断是close wait致使的假死 git

2.3 查看内存使用状况
// 查看内存使用状况
jmap -heap 12635

Eden Space 内存基本耗费完,但没有触发GCgithub

2.4 查看线程状态

-F to force a thread dump. Use when jstack <pid> does not respond (process is hung) 强制线程转储。当jstack <pid>没有响应时使用(进程挂起)tomcat

// 将该进程的全部线程信息打印输出至指定文件
jstack -F 12635 >> jstack-12635.log

发现全部的线程处于BLOCKED状态 jvm

2.5 jstack -F后发现该tomcat进程从假死状态恢复到正常状态

3.结论(未完待续)

3.1 初步判断

极其像Linux内核的一个bug, 某个switch分支缺乏memory barrier的正确处理,致使外部应用如JVM的lock被错误锁住;通常jstack连后就恢复 连接地址操作系统

参考资料线程

扫描二维码关注“熊英的小屋”,这里永远有一个位置为你开放 3d

相关文章
相关标签/搜索