Supervisor 管理进程,Cloud Insight 监控进程,完美!

Supervisor 是由 Python 语言编写、基于 linux 操做系统的一款服务器管理工具,用于监控服务器的运行,发现问题能当即自动预警及自动重启等。html

Cloud Insight 是一款次世代监控工具兼数据管理平台。使用 StatsD 采集性能指标,在 HBase 存储之上,使用 OpenTSDB 来对性能指标进行聚合、分组、过滤。python

使用 Supervisor 的缘由

  • 若是你有不少进程在跑,不时还须要 start/stop/restart 一下进程linux

  • 若是哪天因为某种缘由,进程挂了,你须要重启进程或定时执行脚本web

  • 若是有多个进程,有些是同一项目,尽可能能够同时启动/中止等服务器

若是你有以上任意一种状况,那用 Supervisor 管理进程无疑再合适不过了,把你全部 *nix 进程都配置进 ini 文件中,这样全部的进程就变成了 Supervisor 的子进程。对于子进程,Supervisor 能够作到准确管理(有 web 界面),能够进行分组,一组组的 或者受权非 root 用户。运维

Supervisor 管理进程, Cloud Insight 监控进程

Supervisor 只能管理进程,对进程进行操做,但不能监控进程,虽然有 web 界面能够显示/管理的进程,但不具有通常意义上的监控。例如实时展现进程数据,出现问题有相应报警邮件。工具

Cloud Insight 能够监控 Supervisor 管理的进程数量和运行状况,也能够单独监控进程,也就是说进程不管是否被 Supervisor 管理,Cloud Insight 均可以监控。性能

Supervisor 管理进程,Cloud Insight 监控进程,完美!

像上面图片这样,监控全部进程的 IO 读写,内存,CPU,打开文件等等,也能够配置单个某一个进程的上述指标,查看正常状况下进程的资源消耗,若是出现异常邮件报警。例如假死等状况发生的时候,进程也没挂,但资源消耗会有异常,这些经过告警统统提早知道。spa

Cloud Insight 支持监控 Supervisor

Cloud Insight 不只能够监控进程相关的数据,一样支持监控 Supervisor。Supervisor 管理进程的启动/中止/重启,若是 Supervisor 自己出问题了,那前面那些进程操做也就执行不了,虽然 Supervisor 自己不会出现什么问题,但这也不是万无一失的,因此监控上仍是好的。操作系统

监控进程,设置告警

若是有一个进程挂了,或者假死,怎么可以及时知道?

Supervisor 管理进程,Cloud Insight 监控进程,完美!

配置上图这样的报警策略:

  • 选择性能指标:指标任意选一个 process 的指标,over 选定特定进程,例如 process:python 就是监控 Python 进程数据的。

  • 设置报警条件:设置一个阈值,达到阈值时会触发报警;此外还能够配置设置数据丢失(进程挂了天然也就不会再发送数据)时,直接发送报警邮件。

  • 再下面,就是命名报警和设置通知用户。

总之,若是你关心你的应用进程状况,或者在使用 Supervisor,不妨试试 Cloud Insight,永久免费版等你来用!

OneAPM Cloud Insight 集监控、管理、计算、协做、可视化于一身,帮助全部 IT 公司,减小在系统监控上的人力和时间成本投入,让运维工做更加高效、简单。想阅读更多技术文章,请访问 OneAPM 官方技术博客

本文转自 OneAPM 官方博客

参考文档:

相关文章
相关标签/搜索