OneAlert:国内首家 SaaS 模式的云告警平台

随着互联网行业的高速发展,企业 IT 应用环境日趋复杂。几分钟的故障就会严重到用户体验,那么如何有效下降IT故障带来的影响呢?权威数据代表,86%的企业认为创建有效的监控系统和告警系统、提高 IT 的可见性是最佳的方式。html

9月1日,国内第一个 SaaS 模式的云告警平台 OneAlert 宣布上线,该平台集成了国内外多种主流的监控和支撑系统,实现一个平台上集中处理全部 IT 事件,从真正意义上提高了 IT 可靠性。OneAlert 是国内应用性能管理领军企业 OneAPM 旗下的产品。ios

OneAlert:告警通知必达

研发背景

其实,在 IT 运维支撑工做中,大多同窗都使用了 Zabbix、Nagios 等开源监控工具或者是其余监控工具,他们常常面临着如何配置提醒通知的问题。服务器

  • 邮件通知,各工具配置都比较复杂,自建的邮件服务器还可能不太靠谱,并且邮件通知太慢了,主要是邮件客户端的接收延迟。
  • 短信通知,复杂度过高,对接运营商短信网关,或者是使用短信猫方式,都须要开发配合。使用短信猫还面临在机房里面信号极其不稳定的问题。
  • 其余??想一想而已~

OneAlert 是如何解决该问题的呢?在这以前,咱们先说一个典故:微信

典故
1815年6月18日的滑铁卢战役,是拿破仑和威灵顿两国军队之间的生死交锋,一旦英国取胜,英国公债必然迅猛增加。拿破仑军队在傍晚时分败局已定,罗斯柴尔德法国家族收到现场情报反馈后,第一时间将法军战败的消息抄写6份,6位信使同时从不一样路线发送至英国,英国的罗斯柴尔德掌权人内森第一时间获知,比威灵顿将军信使还要早好几个小时。内森先大幅抛售英国公债,形成市场极度恐慌,以后内森悄悄低吸。当次日滑铁卢大捷消息发布后,伦敦证券交易所,英国公债一路飙升,罗斯柴尔德一举赚进2.3亿英镑(至关于如今500亿美圆)!运维

OneAlert 解决方案

该典故与监控与告警通知场景如此类似:工具

  • 多渠道:6位信使不一样路线。能不能使用更多的渠道,解决邮件或者短信单个路径不靠谱的问题?
  • 及时:告警事件消息通知要及时,不然还不如等终端用户投诉电话。
  • 通知到位:若是典故里面的消息仅通知到罗斯柴尔德英国家族的门卫同窗,那么结果可想而知。一样道理,若是当时负责运维支撑的同窗A在睡觉,而没有其余同窗收到通知,前面的工做都白费了。

OneAler 是如何解决该问题的呢?下表列出了几个关键点:性能

图表

OneAlert 优点

从上表看出,OneAlert 经过6个渠道(6个信使)经过多个运营商/服务商(不一样线路)通知到位(升级)。OneAlert 在多个方面进行了优化:优化

OneAlert:国内第一个 SaaS 模式的云告警平台

  • 部署简单:传统的 Zabbix 或者 Nagios 等监控工具须要复杂配置,而 OneAlert 仅须要5-10分钟便可以完成配置。阿里云

  • 更易用:微信已成为咱们平常生活和工做标配,OneAlert 让告警事件在拇指尖就能够完成确认处理;优化的新版 APP 也将即将发布。htm

  • 更可靠:OneAlert 采用不一样的运营商和服务商进行信息推送,总有一种渠道通知到位,避免自建邮件服务器或短信猫的单一链路故障问题。

  • 分层通知模式:我的能够设置几种渠道的通知方法,如告警发生后即刻微信/邮件/APP 通知,1分钟后告警无响应,则电话通知。基本上哪怕是大半夜在睡觉,也能够叫醒。若是手机停机?没问题,自动升级提醒其余同窗,直到有人响应告警为止。

  • 集成多数主流的监控工具:目前已经支持国内外主流10多种工具告警接入,包括阿里云、腾讯云、VMWare 等云平台,以及 OneAPM、监控宝、Solarwinds、Zabbix、Nagios 等监控工具,并且新的工具还在不断补充中。

多渠道通知

通知到位

做为国内首家云告警平台,OneAlert 与传统的监控方式相比,更便捷、更可靠、更可信赖。据了解,OneAlert 不只提供事件处理生命周期管理,还提供事件解决后的分析回顾功能,发现事件的趋势,最终帮助企业创建以数据指标驱动的团队文化,预防和持续优化。

咱们相信,在「互联网 +」的大潮下,OneAlert 将与运营支撑同窗一块儿,让 IT 业务更稳健可靠,帮助企业有效下降 IT 故障,保证良好的用户体验。

本文系 OneAPM 工程师编译整理。想阅读更多技术文章,请访问 OneAPM 官方博客

相关文章
相关标签/搜索