时间:18.11.22 sql
公司最近因业务,有大量注册,天天大约几万,貌似也不过高?数据库
晚上8点左右,网站后台,前台忽然大面积提示502.网站几乎瘫痪。买的阿里云的负载均衡和读写分离。分别是5台服务器和1主2从。服务器
查了一下阿里云及服务器各项负载状况。发现其中一台只读数据库cpu高达98%。主实例正常。另外一台只读cpu20%。其余均正常。负载均衡
二. 解决:优化
发现是只读DB的问题,但实际上主实例和另外一台db都没问题,不应直接网站都瘫痪啊。网站
没办法,只能把高cpu的DB重启,重启后发现另外一台又高了。没办法。只能临时把网站链接地址改回主实例的地址。网站恢复正常。阿里云
三. 后续:spa
次日找了阿里工单提问,只说因部分sql较慢,致使的cpu太高。但貌似这解释不是很合理。又查了下QPS,TPS但都不高,最高一百多。blog
主实例和两台只读负载状况。后台
目前优化了sql,观察看看是否还会出现问题。