Rainbond V3.7.1 发布,零配置支持全方位集群资源监控与报警

Rainbond是一款以应用为中心的开源PaaS,由好雨基于Docker、Kubernetes等容器技术自主研发,可做为企业在公有云或私有云环境下的应用交付平台、DevOps平台、自动化运维平台和行业云平台,或做为企业级的混合云多云管理工具、Kubernetes容器管理工具或Service Mesh微服务架构治理工具。

继Rainbond V3.7.0版本大量提升平台稳定性更新后,咱们又推出了V3.7.1版本,本次更新进一步完善集群全方位的监控与报警体系。Rainbond集群须要监控的目标分为三类:html

  • 节点操做系统和硬件指标

    Rainbond每一个节点的资源使用状况和健康情况的监控和快速发现故障对于Rainbond运维人员来讲是很是必要的。Rainbond Node服务集成了node-exporter,运行于全部节点之上,暴露出通过精简的Prometheus规范的操做系统和硬件的指标。node

  • 管理服务监控指标

    Rainbond全部服务和第三方服务都提供了Prometheus的exporter API,以暴露当前服务的关键监控指标。git

  • 应用容器资源指标

    应用运行的实例容器的资源占用状况(内存、CPU、IO、Net)虽然不能直接体现应用的负载状况,但能够配合应用业务级性能分析定位应用问题。容器的监控具备特殊性,容器是一个飘忽不定的监控目标。应用是肯定的。所以Rainbond监控的维度是应用级容器。当前版本采用收集Kubelet集成的Cadvisor收集的容器监控指标。但其因为监控指标比较丰富,大多数状况下监控系统会冗余大量无用数据。Rainbond后续版本将精简容器监控指标。github

Rainbond 提供了rbd-monitor组件,组件由monitor进程服务和Prometheus服务组成。monitor服务有如下几方面工做:docker

  • 自动发现三方面监控目标。
  • 自动生成监控目标Prometheus配置并生效。
  • 提供配置报警规则的API服务,并自动设置Prometheus生效。用户能够经过grctl命令方便设置报警规则。
  • 自动对监控目标进行自动分类,集群统筹数据分区,以解决单机监控目标数有限问题。[TODO]
  • 对外提供集群负载的查询API, 屏蔽底层Prometheus的数据分区差别,相似于项目thanos [TODO]

Rbd-monitor提供的查询API, 数据显示方面可对接Grafana进行可视化,对接Altermanager进行报警信息处理。微信

instance-monitor

<center>应用实例内存使用占比</center>架构

instance-monitor

<center>容器资源监控</center>app

instance-monitor

<center>操做系统和硬件指标监控</center>运维

instance-alerting

<center>报警规则</center>svn

除此以外,当前版本还带来了一系列改进:进一步优化源码构建体系,支持SVN基于Tag方式构建应用、支持Maven的子项目构建、改进源码构建容器的建立策略,使用原始代码建立容器替换掉调用docker run命令以解决以前版本关于复杂构建变量没法传入的问题。为方便用户调试源码,支持使用grctl工具对源码进行脱离平台的检查和构建。经过简单的命令快速验证源码是否符合Rainbond要求。

另外,借鉴广大企业用户对于Rainbond产品的使用体验的反馈,支持了应用的批量删除与批量移动组别、优化日志推送与存储、支持更改数据中心内部仓库域名等功能。

具体更新清单以下:

新增功能

  1. 增长应用实例所建立容器的资源指标 【文档】
  2. 增长节点操做系统和硬件指标监控 【文档】
  3. 增长各服务组件健康监控 【文档】
  4. 增长应用异常事件的查询与处理 【文档】
  5. 增长控制台可视化应用每一个实例的内存使用状况 【文档】
  6. 增长支持自定义Prometheus报警规则 【文档】
  7. 增长monitor组件与Alertmanager的对接支持 【文档】
  8. 增长对SVN基于Tag版本选择构建的支持 【文档】
  9. 增长支持更改数据中心内部仓库域名 【文档】
  10. 增长批量删除应用,批量移动分组功能 【文档】
  11. 增长grctl命令行工具支持源码构建测试 【文档】
  12. 改进操做日志和构建日志的推送与存储
  13. 改进源码构建容器的构建策略,支持更多的参数传入

已知问题修复

  1. 应用导出时存在的bug
  2. grctl获取应用信息时的信息缺失
  3. 自动部署提供的URL错误
  4. 解决了应用备份因为版本不存在致使的bug

关于Rainbond 5.X的RaodMap的草案讨论

Rainbond至开源以来,深受社区用户的欢迎,已经有大量企业用户尝试使用Rainbond做为企业产品开发,架构,运维和交付的重要基础平台。Rainbond在经历了3.X 系列7个版本的迭代周期之后,即将进入5.X版本周期。Rainbond团队将在Rainbond 5.X体系中深刻与社区生态结合。你是否关注PaaS、Kubernetes, 微服务架构领域呢?

点击查看并参与Rainbond 5.X版本规划:

About Rainbond 5.X RoadMap Community needs collection

了解更多

相关文章
相关标签/搜索