一份来自滴滴运维工程师的监控系统建设心得

监控,是运维的眼睛,是稳定性建设中最重要的一环。 一般来讲,基础监控系统的主要功能就是发现问题。 故障发生前,通过监控的看图巡检,发现隐患;故障发生时,通过实时的告警,快速发现问题,定位问题所在;故障发生后,使用过去的历史数据图表,进行事后复盘,避免下次发生。 本篇文章,我们不讨论根因定位、故障自愈之类的高端主题,只跟大家聊一下笔者关于基础监控系统的一些建设心得。 一、一般监控系统的功能 一般的基
相关文章
相关标签/搜索