查询响应慢,DB近乎崩溃

时间:18.11.22 sql

一. 起由:

公司最近因业务,有大量注册,天天大约几万,貌似也不过高?数据库

晚上8点左右,网站后台,前台忽然大面积提示502.网站几乎瘫痪。买的阿里云的负载均衡和读写分离。分别是5台服务器和1主2从。服务器

查了一下阿里云及服务器各项负载状况。发现其中一台只读数据库cpu高达98%。主实例正常。另外一台只读cpu20%。其余均正常。负载均衡

二. 解决优化

发现是只读DB的问题,但实际上主实例和另外一台db都没问题,不应直接网站都瘫痪啊。网站

没办法,只能把高cpu的DB重启,重启后发现另外一台又高了。没办法。只能临时把网站链接地址改回主实例的地址。网站恢复正常。阿里云

三. 后续spa

次日找了阿里工单提问,只说因部分sql较慢,致使的cpu太高。但貌似这解释不是很合理。又查了下QPS,TPS但都不高,最高一百多。blog

主实例和两台只读负载状况。后台

 

 

 

目前优化了sql,观察看看是否还会出现问题。

相关文章
相关标签/搜索