你们好,很是抱歉!今天10:28-10:51期间因为阿里云云盾流量清洗,以及切换IP后负载均衡的带宽跑满,影响了主站的正常访问,给您形成了很大的麻烦,请您谅解!网络
故障的过程是这样的:负载均衡
10:28,咱们收到了来自阿里云云盾的通知短信:网站
【阿里云】尊敬的用户:您的 IP 遭受外部流量攻击,已启动免费清洗服务...阿里云
之前也收到过几回这样的通知短信,根据以往的经验,这样的云盾流量清洗不会影响网站的正常访问。blog
但是今天收到短信后,忽然发现主站www.cnblogs.com不能访问了(当时咱们是经过上海电信的网络访问的)。当时很着急,当即上云盾控制台查看状况,攻击流量在云盾的承受范围内,不是流量攻击形成的不能访问。怀疑问题与云盾的流量清洗有关。因此,一边联系阿里云客服,一边进行了DNS解析切换,将流量切换到了另一台SLB(阿里云负载均衡)上。经验
可是在切换时,咱们忘记了另一台SLB上设置了带宽限制。开始的时候因为DNS解析没彻底生效,没察觉带宽问题,等后来DNS解析逐渐生效后,因为带宽跑满形成主站访问速度慢,等咱们发现后才恢复正常。(这是咱们在此次处理故障过程当中的疏忽,咱们会认真反省,吸收教训)co
以后,原来的SLB在中止流量清洗以后,也恢复了正常。流量清洗期间的不能访问多是云盾清洗期间误屏蔽了一些地区的IP,这个有待阿里云的进一步分析。block
在此次故障中,咱们深入体会到在面对紧急问题时保持沉着冷静的心态是多么重要,不然很容易在处理现有问题过程当中制造出新的问题。带宽