没有超时和隔离差点引发的系统雪崩

20170602公司开始618的第二天,收到了业务线订单量下滑的告警。 查看监控平台,移动端下单接口可用率掉到了99.999%,同时服务端调用次数也有一定幅度的下降。既然可用率不到100%,接口肯定有异常,遂根据关键词搜索错误日志,但是未发现有效日志数据。查看其它时间段可用率,发现并未全部是是100%,有些是由于用户的虚拟资产异常引起的可用率下降。但是其他时间段没有调用次数下降,也没有订单量下滑的
相关文章
相关标签/搜索