PE: Production Engineer,应用运维或者业务运维。当业务发展到必定规模时,会出现专门的DBA,配置管理员,网络工程师和安全工程师等等,这个时候的部分运维开始专一于业务,PE的概念最初来自于雅虎而后经由阿里巴巴发扬光大。PE须要关注业务的整个生命周期而不只仅是业务的运行环境,这个时候的PE须要了解业务,保障业务的稳定性,梳理业务链路,分析性能瓶颈,进行容量规划,以及做为开发人员和DBA,网络工程师,配置管理员之间的协调者。同时PE须要和开发人员合做或者自主开发简单的运维工具,主持故障恢复及问题分析。
DevOps: Development and Operations,突出重视开发人员和运维人员的沟通合做,经过自动化流程来创建流水线式的业务流程。DevOps的概念最先来自于欧洲,近几年因为微服务,docker等技术的成熟兴起于美国互联网公司如Google,facebook。DevOps不只仅是运维的工做,不能简单理解为运维开发,它其实涵盖开发、测试和运维。DevOps既然是运维和开发的结合,就必然会出现两个方向的融合。从运维到DevOps,须要运维人员开发自动化运维系统实现自动部署,持续交付,自动测试,监控报警等等,将平常运维工做交由系统完成,解放生产力从而专一于将更多的运维经验落地成DevOps自动化系统;而从开发到DevOps,则须要开发人员会熟练使用自动化运维系统管理本身的应用的整个生命周期,实现高效交付,高可用。SRE: Site Reliable Engineer,可靠性工程师。SRE的概念是由Google提出来的,它是DevOps落地的产物。SRE不只要平常运维和工程研发,还要负责应急响应和业务规划。一般SRE团队成员来自于运维团队和各业务线,他们须要熟悉所负责的整个业务架构和流程,当天值班成员能够自行处理紧急问题。
AIOps: Algorithmic IT Operations 或者 Artificial Intelligence Operations, 智能运维。随着大数据和AI的兴起,AIOps也被提了出来。运维工做的核心概括起来就三点:发现问题,分析问题和解决问题。当自动化运维系统落地以后,人的主要做用就是根据问题做出决策,所以AIOps就是基于人的经验到基于机器学习的转变,经过人工智能对大量运维数据的学习来做出准确的决策。AIOps能够根据监控数据预测故障发生并及时定位和恢复,也能够根据业务数据预估容量。