记一次集群内无可用http服务问题排查

1.摘要 前一阵子发现服务会有偶发的服务不可用的情况,记录一下这个问题的排查过程。 现象是这样的:每天到了某个时间点,就会出现服务不稳定的情况,偶发接口调不通。 线上业务使用了lvs-nginx-tomcat三层结构,首先查看tomcat监控,没有什么特别异常的情况,响应时间和错误码没发现有什么异常,CPU、IO等等指标也都正常。 再查看nginx上的监控,发现在某个时刻这个服务的5xx报错突增,
相关文章
相关标签/搜索