前两天我被一篇「不是由于坚强而漂亮,而是由于漂亮而坚强」的文章震撼到了,一个丑女孩(原谅我,文中女孩未减肥前实在够不上漂亮二字),成功瘦到只有原来的一半!由于身材变好,整我的彻底不同了,更自信更乐观更坚强了!这就是颜值不够身材凑的典型!浏览器
图注:我大 GiGi 很美,由于身材炒鸡棒更美!郑重声明照片费上文中提到的 MM。
固然今天小编并不是要分享本人的瘦身经历,固然小编也没有过减肥的经历(小编近五年维持身高161cm,体重49kg,说不上瘦,但也够不着胖),可是小编却有过其余方面的经历能够分享给你们,一样是对没法克服的缺陷另辟解决蹊径。网络
不管咱们是运用 24x7 小时网络运行中心( NOC )和记录详尽的进程来实现传统运营过程,仍是经过多功能团队和高迭代式性方法来学习 DevOps 模式,咱们都面临一个问题,那就是在监控系统、监控告警和咱们用来处理运营问题的过程之间沟通不顺畅的状况日益增多。咱们一般会在工单里记录下事件,可是处理工单的员工是否知晓潜在事件下的实时状态?运维
对于重置密码、更换硬盘或是修复用户手机等帮助中心类任务,这个问题的意义不大。但现在环境复杂,监控系统层层堆栈,要想团队与不断变化的服务问题保持同步确实是不小的挑战。工具
以咱们在运营中常见的典型工做流模式为例。可能存在这样的状况:咱们收到的告警可能来自一封邮件、一条短信或者控制面板给出的指示。此时,咱们能够经过已定义的流程或特定流程来处理这个事情,好比打开一个工单,直接对这个事件进行分析调查。咱们也能够参照说明书、打开终端会话、查看某些图表或是运行特定的诊断工具等任何当时咱们能想到的办法。若是咱们本身没法解决,能够经过转发功能或者设置的升级策略让更适合的人处理故障。学习
可是潜在的故障问题会随时爆发,并且咱们使用的监控系统各不相同,愈来愈多相同或者相似故障问题的告警塞爆了咱们的收件箱,或是让咱们的手机响个不停。不止一个客户反映:当故障已经被确认到解决该故障期间,仍然会不停收到相同告警内容的邮件和短信!这实际上是不合理的。spa
对此,OneAlert 给出了一个既简单粗暴的解决方案。当告警出现时,咱们就已经把这些告警收集到一个级别更高的容器中,咱们称之为「事件」。一旦你着手解决手头上的某个实际问题,咱们认为,既然这些告警都与目前正在处理的问题相关,那就能够把它们全都集中到一个实时的状态页面,做为调查分析和解决过程当中最可靠的帮手。能够直接在移动设备上打开,也能够在桌面浏览器中打开。你在解决问题时,会发现告警状态也在不断变化。它可让原先在分散各处的操做台、控制面板、日志查看软件等资源变得有条理一些。不会再由于告警为解决而不停收到相同告警邮件和短信而烦躁了,这都是变相的压力呀!日志
事件解决之后,OneAlert 最多能保留一年内发生的全部告警事件。如此庞大的分析功能,对事件分析提供了多大的便利!全部在中断过程当中影响到系统的告警都逐个逐条、条理清晰地罗列出来。事件的发展所有呈如今一张大表里面,包括各类不一样的告警及其在整个过程当中的状态变化。本来,过后为了反思整个过程,须要从新组合排列全部邮件和其余资源(告警事件越多,时间越久,所浪费的整理事件越长),如今彻底能够省去这部分的人力和时间。code
全部人均可以在同一个云告警平台 OneAlert 操做,能够看到整个处理过程,包括处理人、处理方式、处理内容、处理结果等,全部人的认知都随时保持同步,彻底排除因沟通不顺畅致使的故障没法顺利和按时解决的问题。blog
很是不错吧?平常生活中,人与人之间的沟通必不可缺,可是对于运维,特别是须要处理很是环境庞杂的问题,有些流程上能 cut 沟通,若是可以经过同一个平台简单直观的同步达成全体人员的共识,咱们何乐而不为?更况且,这个平台还能对你的告警进行事件聚合,免受告警风暴的影响,告诉我,你真的想错过么?进程
快点行动起来吧,仍是免费的哟!与 OneAlert 一块儿携手,从头至尾改善你的事件管理吧!更多内容可参看OneAlert 官网 。
参考文献:Get everyone on the same page... Literally
本文转自 OneAPM 官方博客