详解 Ops 智能运维机器人,故障处理又快又准!

作者|  阿里文娱高级开发工程师 见乔 责编 | 夕颜 出品 | CSDN(ID:CSDNnews)   背景 对优酷来说,核心业务全年需要有很高的业务可用率。对于故障处理则有 1-5-10 的目标, 即 1 分钟发现、5 分钟定位、10 分钟恢复。当前我们的技术架构越来越复杂,线上的一次请求, 可能会经过非常复杂的调用链路,当业务出现问题时,如何快速发现和止血,是当前系统运维 体系的核心点之一。
相关文章
相关标签/搜索