优云蒋君伟:自动化运维成本仍然很高

9月10日-11日,上海光大国际会展中心隆重举办了“2017上海站CNUTCon全球运维技术大会”。本次大会的主题是“智能时代的新运维”,各个公司为观众带来了他们关于该主题的思考,并分享了他们的实践经历。InfoQ有幸邀请了杭州优云软件有限公司的产品副总裁蒋君伟老师接受咱们的采访。谈到对自动化运维将来的展望,蒋老师表示自动化运维必然是大势所趋,可是由于相关技术债务的存在,自动化运维的成本还很高。那优云本身的技术与产品是如何去作高效运维的呢?本次采访带你了解一二。css


优云automation
 

InfoQ:与其它同类产品相比,优云有哪些优点?前端

 

蒋君伟:要介绍优云的产品优点,我想能够简单说明一下优云是如何来的。优云来自广通,广通公司成立于2003年,14年以来一直专一于运维领域,广通的产品也随着运维行业的趋势发展,从最初的监控、CMDB、ITIL到APM,行业的客户也深刻到政府、金融、运营商领域,咱们对用户运维痛点与上一代运维产品的瓶颈,有深入认识。python

因此,2016年,广通成立全资子公司,推出了新一代运维产品线优云,与同类产品相比,咱们有如下优点:算法

1.平台化:打通运维场景,避免运维信息孤岛与运维工具碎片化的状况shell

2.自动化:结合自动化操做编排,实现故障自愈与运维自助式服务安全

3.社交化:经过ChatOps App,由运维机器人辅助运维人员,随时随地完成运维工做服务器

4.大数据:内置运维数据分析算法,有效解决数据中心容量规划难题网络

5.分布式:支持水平扩展,可随资源规模增加而增长管理能力架构

 

InfoQ:优云产品采用了哪些核心技术?运维

 

蒋君伟:优云产品的核心技术包括:

 

一、 安全、稳定、低负载、易扩展的采集代理平台

采集代理是运维体系中很是重要的落地工具,因为企业用户的环境很是复杂,因此采集代理在技术设计须要很是注意:

优云Agent主要使用Python与Java技术平台实现,因此在服务器的兼容性上有很大保障;

为兼容被防火墙与网闸隔离的网络,Agent老是单向对Server发起链接,拉取做业或上报结果,这种方式也可让Agent集群造成一个网状级联,兼容多级网络;

同时Agent会主动下降进程的优先级,以下降CPU消耗,控制内存与磁盘使用,将对部署服务器的影响降到最低;

Agent使用强引擎弱脚本的设计思路,内置了ssh/wmi/snmp/ipmi等交互协议,容许用户快速使用shell/python/groovy等脚本快速扩展Agent能力。

 

二、 可视化埋点技术

 

优云UEM产品能够实现用户Web端与移动端的用户操做体验监控,不像传统的用户体验监控产品,咱们不须要预先埋点,咱们能够帮助产品经理生成用户的操做热区,并直接在产品界面上操做,决定要关注哪些用户的操做行为。这个埋点依赖两个部份完成:

用户交互数据的全量抓取技术:经过在应用端部署前端agent js, agent会监听页面中的相关操做,好比点击事件,超连接等,将相关数据(好比来源、去向)所有记录下来,并每隔1分钟进行上报,由服务端存储分析。

用户界面元素标记技术:能够直接在被监控应用端进行框选,设置页面元素标记,这些元素会和全量采集的数据进行匹配(好比经过匹配css选择器、文本等)。经过这种可视化标记的方式就能够直接关注用户须要的数据,无须开发者手动对页面元素进行埋点。

 

三、全链路监控技术

 

优云UEM与APM,已经将用户端的操做与服务端对此操做的执行过程结合在一块儿,经过UEM的用户端请求染色,能够跟踪每个请求操做到服务端,针对服务端的经常使用RPC协议,如http/dubbo/rmi等,也能够经过嵌入式agent进行染色与跟踪。所以,一笔操做所通过的每个计算节点与数据存储节点的调用堆栈,咱们均可以捕捉到,并能呈现分析其中的瓶颈节点与代码。

 

四、 图像质量分析算法

 

优云VideoMon产品使用的图像与视频质量分析算法,能够快速完成摄象头成像质量的分析,其中诊断的准确性与快速是技术关键。使用信号波动检查、像素灰度值分析、非灰色像素集中区域分析、图像弱边缘数分析等算法,来实现视频信号丢失检测、偏色检测、清晰度异常检查等功能。

 

InfoQ:谈谈对全栈双态运维解决方案的具体理解?

 

蒋君伟:这里有两个关键词:

1.全栈

全栈体现了解决方案的覆盖面是完整的,运维的对象,能够从基础架构到业务应用;从物理资源到云资源;从用户端到服务端的全链路运维。

2.双态

双态则有两层含义。从技术层上来讲,双态要求产品能同时进行传统IOE架构的运维,以及x86架构的云资源运维;从管理上来讲,应能支撑ITIL与DevOps这两种运维体系。

我认为全栈双态运维解决方案,应该能知足这两个关键词。

 

InfoQ:优云产品解决方案已经应用到了哪些行业和哪些客户中?具体效果如何?蒋君伟:自16年7月发布咱们的产品后,不少用户都很是踊跃,到目前咱们也实施了很多典型案例:

 

一、 某金融双态方案,实现云资源交付的服务自助化

金融目前是最典型的双态运维场景了,一方面金融核心系统要保持很是稳定,是稳态,另外一方面移动支付渠道又要求应用的迭代与响应很是敏捷,是敏态。

经过优云的Monitor,咱们实现了传统业务与互联网业务的全栈监控;而且经过ITSM实现流程自助服务,业务部门提交的资源申请工单,在审批经过时,借助CMDB与Automation,实现业务部门的资源交付、应用部署自助化。

二、 某部委业务大数据分析监控方案

此客户全国拥有数万的站点须要上报业务数据,这些数据的处理要求很是高的时效性与准确性。因为站点的规模变大、数据种类增长以及数据监控粒度的增长,旧的业务支撑保障系统已没法知足对业务数据的实时监控需求。

优云Store运维数据平台具备大数据分析能力,能实现这些上报的业务数据实时流数据处理,结合CMDB中的站点基本信息,实现监控指标的多个管理维度分析,并经过Show大屏可视化呈现全国的数据质量。

三、 某海外平安城市运维项目

平安城市中存在大量的IT设备与海量的物联网设备须要运维管理,其运维团队对于整个城市的摄象头故障老是头痛不已,一直处于被动运维的状态。

优云VideoMon能快速完成上万路的摄象头图像质量分析监控,大量减小运维团队的巡检成本。对存在故障的结点,优云Alert经过告警热图功能,从地域、类型、业务等多个维度,为用户呈现故障分布状况,快速帮助用户找到问题根源,缩短故障修复时间。

 

InfoQ:谈谈对自动化运维的展望。

 

蒋君伟:自动化运维必然是大势所趋,而且会愈来愈快地改变咱们的运维工做,目前咱们所处的时代是一个旧与新的过渡时代,就像集装箱发明后的航运业同样。

在集装箱刚开始被发明出来的阶段,你们从心理到技术上都没有做好准备,包括货主、公路、铁路、港口、吊车到轮船,都没有为集装箱作好配套。但因为几个关键事件,集装箱的标准化,以及随之配套的操做、运输手段,很快就改变了全世界。

咱们如今也是,虽然容器及服务、函数及服务技术已经出现,但咱们还有太多的历史债务须要偿还,因此如今的标准化与自动化的收益还不明显,自动化运维的成本还很高。

但随着历史债务的解决,新的应用研发、运维手段,都会围绕着这些新技术配套起来,到时候自动化运维就很是容易实施与得到巨大收益。

最后,咱们运维人员也会像码头工人同样,须要改变咱们的技术工做内容与深度,不然就会被下岗。

 

嘉宾介绍:

 

蒋君伟,优云产品副总裁,IT运维领域的十年老兵,前后研发了网络管理、系统管理、CMDB、ITSM等产品,并成功建设了国内多个全国性的网络管理与运维管理项目。现从事优云新一代数据中心运维产品研发工做,主要负责产品线规划、核心技术研发、研发团队建设与运维咨询等工做。

相关文章
相关标签/搜索