OpenStack企业云平台监控实践

摘要:
《OpenStack企业云平台架构与实践》结合做者亲身经历的各种OpenStack的咨询、规划和实施经验,从理论和工程角度,讲述如何将OpenStack变成企业可靠的、托管企业各种生产环境的云平台的方方面面。本文节选自第8章。
性能监控

对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是同样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展现在OpenStack部署中使用最多的一款开源软件Ganglia。

Ganglia须要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各类视图。另外,Ganglia服务器端进程还能够组成集群,提供高可靠性,用于支持大型或生产环境的监控。

图1展现了用Ganglia来展示一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。



图1  Ganglia的Overview界面

图2展现了4个节点的Load视图,并在一个视图中进行聚合展现。不一样颜色标识不一样节点的负载状况。



图2  Ganglia的聚合视图和节点视图

图3是CPU详细监控项目。



图3  Ganglia的CPU监控

图4是一个二次开发的,能够用来监控节点运行的虚拟机的性能,本图展现的是监控一个虚拟机的视图。


图4  Ganglia监控虚拟机内存

服务与资源监控

Nagios是在OpenStack部署中普遍使用的,用于监控云平台各类服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。

图5展现了Nagios的链接视图,这里5个节点在同一个网络里。绿色表明该节点服务正常,而红色则说明该节点至少有一个以上的告警须要处理。



图5  Nagios的链接视图

另外,Nagios能够很容易地与邮件系统和短信平台集成,发送告警信息。

另外,本书展现的界面只是默认的,社区里有许多不一样的展现界面,并且是免费的,能够根据本身的须要和偏好进行选择,提供不一样的样式和数据展示形式。但数据自己则仍是由Nagios服务提供。

图6是Nagios的主机视图,该节点的健康情况,以及信息收集时间等信息一目了然。



图6  Nagios的主机视图

图7展现了Nagios的服务监控视图。默认的Nagios能够监控磁盘、SSH、ping等系统基本服务,可是Nagios对OpenStack却一无所知,这是须要本身进行开发和扩展的,另外网上也有很多免费的监控脚本能够集成进来。



图7  Nagois的服务监控视图

对于OpenStack服务的监控,最基本的能够从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,能够结合不一样服务的命令,经过查询来判断服务自己的质量如何。这须要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但若是云平台修改密码,则这里也须要进行相应的修改。


消息中间件监控

消息中间件在OpenStack云平台起着心脏的做用,运行不正常则整个云平台会运行不起来,所以监控消息中间件在OpenStack云平台相当重要。

图8展现了一款免费软件,能够用于消息中间件统计信息的展示和一些基本管理。



图8  RabbitMQ的Overview视图

图9显示了消息中间件当前的各类链接,这些链接从不一样节点和不一样服务而来。



图9  RabbitMQ的链接视图

图10展现了消息中间件的通道视图。



图10  RabbitMQ的通道视图

图11展现了消息中间件的交换(Exchange)视图。



图11  RabbitMQ的交换视图

图12展现了消息中间件的队列视图,并包括了统计信息。



图12  RabbitMQ的队列视图

图13是管理员视图,能够修改密码、增长用户等。



图13  RabbitMQ的管理员视图

日志分析

OpenStack云平台因为服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试很是不方便,由于关联的服务每每运行于不一样节点之上。

LogStash在各个节点部署了代理程序,能够将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。

图14展现了LogStash的Overview视图,能够看到整个云平台日志产生的数量趋势。



图14  LogStash的Overview视图

图15展现了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并能够按不一样的维度进行排序、关键词搜索。



图15  LogStash的消息视图

图16展现了过滤后的视图,这里咱们只关心哪一个节点在何时发生了什么事情。LogStash能够很好地帮助咱们实现这些。



图16  LogStash的消息过滤视图

#############################
本文节选自 《OpenStack企业云平台架构与实践》第8章第8节,由电子工业出版社,2014年11月出版。

做者简介
张小斌,苏宁北京研发中心云计算研发部负责人,拥有15年丰富的计算机软件设计、开发和管理经验,主要著做有《黑客分析与防范技术》和《计算机网络安全工具》(国内最先的网络安全书籍)。曾在朗讯贝尔实验室和硅谷Terawave等公司工做多年;在HP担任解决方案架构师;在赛门铁克任主任工程师,研发存储备份软件,曾参与公司全球“Cutting Edge”技术大会并作技术报告;在北电网络、Websense、TrustGo分别担任技术经理、研发经理和研发总监职位,曾负责邮件安全、移动安全、移动互联网搜索引擎等的研发管理工做;在VMware和IBM的云计算部门负责云计算产品的架构设计和解决方案等工做。ios

相关文章
相关标签/搜索