根因分析初探:一种报警聚类算法在业务系统的落地实施

背景 众所周知,日志是记录应用程序运行状态的一种重要工具,在业务服务中,日志更是十分重要。一般状况下,日志主要是记录关键执行点、程序执行错误时的现场信息等。系统出现故障时,运维人员通常先查看错误日志,定位故障缘由。当业务流量小、逻辑复杂度低时,应用出现故障时错误日志通常较少,运维人员通常可以根据错误日志迅速定位到问题。可是,随着业务逻辑的迭代,系统接入的依赖服务不断增多,引入的组件不断增多,当系统
相关文章
相关标签/搜索