Linux进程死锁定位

时间 2020-03-15

标签 linux 进程死锁定位栏目 Linux 繁體版

原文原文链接

最近定位一个服务问题时发现telnet某个端口，没法连接。无奈之下只能一步步排查。安全

端口是否存在socket

ss -l|grep LISTEN|grep 9999

若是端口存在那么能够观察该端口上的recv-q send-q 若是是发生死锁通常状况下这两个队列只会增长（固然当服务处理过慢时也会致使包堆积）ide

Recv-Q Send-Q Local Address:Port Peer Address:Port 
0 1024 *:5200 *:*

root 1902 1901 15 11:09 ? 00:31:55 ./client -f ../conf/client.ini -dcode

root 1903 1901 1 11:09 ? 00:02:25 ./client -f ../conf/client.ini -dserver

root 1904 1901 15 11:09 ? 00:31:19 ./client -f ../conf/client.ini -d队列

root 1905 1901 15 11:09 ? 00:31:17 ./client -f ../conf/client.ini -d进程

定位哪里死锁

通过一步步盘查以后，怀疑进程死锁，ok。最好的定位方法就是attach到进程，而后bt一下既能够看到进程hang在哪里。。。

$gdb attach 1903it

#0 0x00007f105892105e in __lll_lock_wait_private () from /lib64/libc.so.6class

#1 0x00007f10588c6cad in _L_lock_2164 () from /lib64/libc.so.6

#2 0x00007f10588c6a67 in __tz_convert () from /lib64/libc.so.6

#3 0x00007f105890da5d in __vsyslog_chk () from /lib64/libc.so.6

#4 0x00007f105889948e in __libc_message () from /lib64/libc.so.6

#5 0x00007f105889ee66 in malloc_printerr () from /lib64/libc.so.6

#6 0x00007f10588c6909 in tzset_internal () from /lib64/libc.so.6

#7 0x00007f10588c6a89 in __tz_convert () from /lib64/libc.so.6

#8 0x00000000004c0917 in shift_fd (lvl=1, fmt=0x55e308 "[%s][%d][%s]: [server] recv SIGSEGV.pid:%d!\n") at ../src/log_xx.cpp:95

#9 write_log (lvl=1, fmt=0x55e308 "[%s][%d][%s]: [server] recv SIGSEGV.pid:%d!\n") at ../src/log_xx.cpp:138

上面这个问题致使是由于进程抛出了SEGV信号以后，在处理信号的方法中使用了非线程安全的localtime，而该方法中会枷锁。