记一次线上CPU持续飙升的问题排查

最近公司的事务多了很多,都很少有时间来更新了。上周六项目上刚刚发生了一次CPU持续飙高,导致服务不可用的线上事故,在此也简单做下记录。 问题排查的过程大概是这样的: 查看业务日志中最开始报错的信息,发现数据库连接超时,redis也连接超时,而且出现了大量的连接超时。所以一开始怀疑数据库挂了导致业务线程一直积压。 DBA排查了数据库的情况,发现数据库并没有压力,也运行正常。redis的存储是满的。
相关文章
相关标签/搜索