如何在多Kubernetes集群和多租户环境中使用Prometheus监控

过去十年里,我一直在虚拟化和云计算领域工做,在VMware、Mercury Interactive和Oracle领导产品管理工做,并格外关注DevOps方向。直到2014年,我开始认真关注并研究容器。当2015年Kubernetes面向大众推出时,我强烈地感觉到,企业须要一种更简单的方法来在其内部环境中部署容器。那时,我创立了Qubeship.io,提供企业级的容器的CI / CD工具。然而——尽管咱们尽了全力应对这一问题——管理Kubernetes集群仍然是一个巨大的挑战。git

而Rancher,解决了这个复杂的问题。它从最初的容器编排引擎,迅速发展成为多集群、多租户Kubernetes管理平台,并解决了全球成千上万家企业在重要的生产环境中落地Kubernetes的难题。github

Rancher 2.2进一步推进了这一发展。Rancher 2.2中将包含许多新功能和错误修复,本文中我将重点分享:工具

  • 新的Alpha版本发布流程性能

  • 为Rancher所管理的集群提供的开箱即用的监控解决方案。测试

Alpha版本发布流程优化

从Rancher 2.2.0开始,Rancher Labs计划在最终2.2 GA发布以前发布一系列alpha版本。这将为用户提供足够的时间来试验新功能,并帮助发现一些潜在问题。云计算

Alpha版本无疑是最新最前沿的,它可能包含新功能、加强功能和错误修复。但咱们不建议用户将任何alpha版本部署于生产环境,而且Rancher也不提供升级到alpha版本或从alpha版本升级的测试或支持。日志

若是某个特定的alpha版本中有某些格外值得注意的功能或修复,咱们会在release note里将它们着重标记出来。重要的已知问题咱们也会标记。咱们会作到尽可能详细,不过这一清单也并不是详尽无遗。blog

无比但愿你们可以尽量多地向Rancher团队提供您在使用alpha版本时的反馈/意见/建议,这也是在产品正式GA以前帮助咱们最大程度地优化产品的绝佳途径!教程

多集群、多租户环境中Prometheus监控的黑科技

Rancher Labs正式宣布了将在Rancher 2.2中引入对Prometheus的里程碑级别的加强支持,从而加强全部Kubernetes集群的可见性,同时确保不一样项目与用户之间的隔离。Rancher也所以成为惟一一个在多集群、多租户环境中支持Prometheus的解决方案。在Rancher 2.2,使用Prometheus监控Rancher管理的Kubernetes环境,只须要两个步骤:

  1. 选择集群

  2. 一键启动监控

搞定!

咱们能够作到这一点,由于Rancher 2.2配备了彻底集成的Prometheus和Grafana。

使用教程:

  • 登录并选择您要监控的集群。须要注意的是,CPU利用率、内存利用率和Pods图表显示的是系统的当前状态。这些指标尽管颇有用,但仅显示如今正在发生的事情。

  • 点开工具选项卡,而后选择“监控”选项。

  • 单击“Prometheus”按钮。关于数据留存以及端口,您均可以使用默认配置。

  • 关于存储Prometheus和Grafana数据的问题,这里也有添加持久化存储的选项。若是您要启用它,请当即选择它。在本文的这个演示中,我没有选中它们。

  • 保存更改。

  • 导航回集群,此时你就能看到更多其余内容了,包括集群指标、Etcd指标、Kubernetes组件指标和Rancher日志指标。

  • 展开每一个指标后,就能查看到该指标下一层新指标。将鼠标悬停在图表上,还能查看到更多信信息。

  • 使用时间序列下拉列表,你还能够进一步放大并查看系统在不一样时间段的性能变化。

  • 单击Grafana图标以查看仪表板:

下面咱们来看看项目级监控。

项目级监控

在Rancher中,项目是一种强大的方式来让多个团队在同一个集群上拥有本身的多租户工做区(或项目)。

选择带有工做负载的项目,而后导航到工具→监控。若是监控还没有启用,能够选择Prometheus监控按钮来启用它。

导航回Workload选项卡并展开如今可用的“Workload Metrics”部分,以查看全部利用率和I / O指标。将鼠标悬停在任意图表上可查看更多详细信息,使用时间序列下拉列表则能够进一步放大并查看特定时间段的状况。

您还能够继续深刻研究Pod甚至容器级指标。只需单击您想要观察的组件,而后参照执行和上文中同样的步骤,就能够查看到Pod指标和容器指标了。

结 论

但愿经过本文,您能了解到如何经过Rancher 2.2中开箱即用的Prometheus和Grafana监控解决方案,来简单快速地完成对多Kubernetes集群、多租户环境的统一监控。

现已有多个Alpha版本可供您体验使用,具体能够参照这里:

https://github.com/rancher/rancher/releases

一如既往,咱们无比期待您的使用反馈。产品的beta版本将很快与您见面,GA时间计划为2019年初,敬请保持关注!

Keep Rancher-ing!

相关文章
相关标签/搜索