今早发现新增首页节点报错,没法链接,部分节点发现问题,说明服务问题可能性不大,因而想到是内核参数的问题。果真因为是新增的节点,没有对系统优化致使。如今是发现问题过程记录一下:
一、查看链接状态,汇总一下
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
CLOSE_WAIT 42
ESTABLISHED 0
TIME_WAIT 1006
二、先优化内核参数
vi /etc/sysctl.conf
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse=1 #让TIME_WAIT状态能够重用,这样即便TIME_WAIT占满了全部端口,也不会拒绝新的请求形成障碍 默认是0
net.ipv4.tcp_tw_recycle=1 #让TIME_WAIT尽快回收 默认0
net.ipv4.tcp_fin_timeout=30
/sbin/sysctl -p #让参数生效
三、重启相关java服务
虽然这是运维发现问题的常识,但由于环境变化,可能会忘记,这里记录一下。java