每一个工做日,一家大型企业均可能存在一两件优先级为 1 级的事件,五六件优先级为 2 级的事件和百来件优先级为 3 级的事件。试想一下,若是公司全部支持人员都要收到每一个事件的通知……不想了,我好方!还能不能愉快的工做了?然而,这样的事情天天都在各个企业里上演。然而支持团队并没有权处理全部事件!他们却须要反复地处理各个事件,若是全球各地的支持团队都如此,想一想这总共得浪费多少时间和多少叠 money 呀!数据库
2012 年全球第一家 ITOA 企业 Splunk 的上市,人们才有了更为有效的方法解决上述问题。网络
首先咱们先科普下 ITOA 到底是为什么物,Wikipedia 如是说:运维
Definition: IT Operations Analytics (ITOA) (also known as Advanced Operational Analytics, or IT Data Analytics) technologies are primarily used to discover complex patterns in high volumes of often "noisy" IT system availability and performance data. Forrester Research defines IT analytics as "The use of mathematical algorithms and other innovations to extract meaningful information from the sea of raw data collected by management and monitoring technologies."
莫装逼,说人话:ITOA 即 IT 运营分析,ITOA 就是经过大数据分析的技术手段来解决随着虚拟化和大数据致使的在 IT 配置、变动和运行过程当中产生的海量数据分析问题,并将这些分析结果转化为清晰的、可付诸实施的解决方法,从而帮助 IT 运维和管理人员大大地缩短故障修复时间,减小事故和宕机次数,平滑地实现无端障的应用发布和系统升级。jsp
大型企业的支持团队若是一直使用现有方法,就没法继续应对天天出现的大量事件。传统的 ITOA 工具全面地解读了一家企业内发生的全部事件,对某些管理人员和主要决策人员较为实用,但每一个支持团队都有其特殊职责,实际上只需关注特定类型的事件就能完成工做。全部额外信息都会使人不知所措,甚至会让人分心。工具
一个解决办法是让每一个人分别设置事件显示过滤器。遗憾的是,这种方法工做量较大,根本不适合常常发生变化的大型企业。必须得有一种更好的解决办法……大数据
为了响应领先企业的需求,OneAlert 如今可将事件根据分派策略的不一样,自动指派给适当团队。“通知全部人” 的时代将一去不复返。借助 OneAlert,管理人员能够恰当地定义其团队、团队成员和重点领域,使事件自动化指派给最须要知道的人,让其余人免受打扰。优化
下面咱们来看一个例子,了解它是怎样提升运营效率的:rest
某个国际企业可能拥有 10 到 20 个不一样的支持团队。这些团队能够按照网络、计算、数据库、存储、云端、系统管理等领域进行分类。假设发生了 IT 中断状况,且在此期间触发了约 10000 个事件。code
传统解决方案:每一个人都快速移动到网桥呼叫上,利用工具对域进行分类,并展现/代表各自的研究结果。orm
大约须要耗费的工时:20
OneAlert 解决方案:建立一个参数。对 10000 个事件进行分析,有 25 个事件与 IT 中断相关,但全部事件都涉及计算和网络层。OneAlert 仅通知计算和网络团队,其余全部团队都不会收到通知。
须要耗费的总工时:2
假设一年中有 200 件优先级为 1 级的事件。若是 OneAlert 能在每一个事件上节约 18 个小时的时间,那么每一年就能为团队节约 3600 个小时,极大地提升了工做效率!普通员工每一年工做 1900 个小时(一年工做 50 周,每周工做 38 个小时),所以对通常企业来讲,OneAlert 提升的工做效率具备重要意义。
OneAlert 团队还能够经过哪些方式来提升工做效率?
若是收到告警信息后,你没法解决该告警,能够迅速转发告警给更适合或专长处理的人;或者设置该告警自动升级到二线排班人员。在事件升级前,OneAlert 提供各类沟通方式,如 QQ 群、简聊、钉钉、App 等,让每一个团队在最大限度内团队解决事件,防止没必要要的升级。
将适当的事件指派给适当的团队,这在提升企业运营效率的道路上,是至关重尽管如此,即便事件由适当团队接手,仍然有很大的空间来优化处理事件的方式。每一个事大的进展。件耗时多久?从头至尾分别采起了哪些措施?是否存在值得注意的问题和根源?是否正确记录了事件?OneAlert 对这些指标进行了监测,提供分析功能,方便管理人员不断了解其团队的工做效率,有利于不断进步。
ITOA 不只是为 IT 运维服务的一套工具,更是一套完整的解决方案,它能够帮助 IT 运维人员更高效地进行运维,提升 IT 运维的效率,是 IT 运维发展到必定阶段的必然产物。
企业最大的财富就是员工,若是不能有效地安排员工工做,就要付出很大的代价。现在,企业面临着 IT 支持不足的窘境,而 OneAlert 正在快速改变这一局面。经过明肯定义各个团队及其指定职责,从而实现对事件的自动指派,最终帮助企业优化支持团队,更快地解决事件。
OneAlert 是北京蓝海讯通科技有限公司旗下产品,是国内第一个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理全部 IT 事件,提高 IT 可靠性。想了解更多信息,请访问 OneAlert 官网,欢迎免费注册体验 。 本文转自 OneAPM 官方博客