supervisor简介

一什么是supervisorhtml

Superviosr是一个UNIX-like系统上的进程监控工具。 Supervisor是一个Python开发的client/server系统,能够管理和监控*nix上面的进程。不过同daemontools同样,它也不能监控daemon进程node

官网:http://supervisord.org/ python

二为啥用supervisorlinux

 

 部署简单 : 为啥简单呢?由于我们一般管理linux进程的时候,通常来讲都须要本身编写一个可以实现进程start/stop/restart/reload功能的脚本,而后丢到/etc/init.d/下面。这么作有不少很差的地方,第一咱们要编写这个脚本,这就很耗时耗力了。第二,当这个进程挂掉的时候,linux不会自动重启它的,想要自动重启的话,咱们还要本身写一个监控重启脚本。而,supervisor则能够完美的解决这些问题。好,怎么解决的呢,其实supervisor管理进程,就是经过fork/exec的方式把这些被管理的进程,看成supervisor的子进程来启动。这样的话,咱们只要在supervisor的配置文件中,把要管理的进程的可执行文件的路径写进去就OK了。这样就省下了咱们如同linux管理进程的时候,本身写控制脚本的麻烦了。第二,被管理进程做为supervisor的子进程,当子进程挂掉的时候,父进程能够准确获取子进程挂掉的信息的,因此固然也就能够对挂掉的子进程进行自动重启了,固然重启仍是不重启,也要看你的配置文件里面有木有设置autostart=true了,这是后话。ios

   集中管理: supervisor管理的进程,进程组信息,所有都写在一个ini格式的文件里就OK了。并且,咱们管理supervisor的时候的能够在本地进行管理,也能够远程管理,并且supervisor提供了一个web界面,咱们能够在web界面上监控,管理进程。 固然了,本地,远程和web管理的时候,须要调用supervisor的xml_rpc接口,这个也是后话。git

  supervisor管理的进程,进程组信息,所有都写在一个ini格式的文件里就OK了。并且,咱们管理supervisor的时候的能够在本地进行管理,也能够远程管理,并且supervisor提供了一个web界面,咱们能够在web界面上监控,管理进程。 固然了,本地,远程和web管理的时候,须要调用supervisor的xml_rpc接口,这个也是后话。github

精确web

为啥说精确呢?由于linux对进程状态的反馈,有时候不太准确。为啥不许确?这个楼主也不知道啊,官方文档是这么说的,知道的告诉楼主一下吧,感激涕零。而supervisor监控子进程,获得的子进程状态无疑是准确的。mongodb

进程组浏览器

supervisor能够对进程组统一管理,也就是说我们能够把须要管理的进程写到一个组里面,而后咱们把这个组做为一个对象进行管理,如启动,中止,重启等等操做。而linux系统则是没有这种功能的,咱们想要中止一个进程,只能一个一个的去中止,要么就本身写个脚本去批量中止。

权限

大伙都知道linux的进程,特别是侦听在1024端口之下的进程,通常用户大多数状况下,是不能对其进行控制的。想要控制的话,必需要有root权限。而supervisor提供了一个功能,能够为supervisord或者每一个子进程,设置一个非root的user,这个user就能够管理它对应的进程了。

不过这功能,用不用就看大伙本身的环境了

 supervisor结构

Supervisord :主进程,负责管理进程的server,它会根据配置文件建立指定数量的应用程序的子进程,管理子进程的整个生命周期,对crash的进程重启,对进程变化发送事件通知等。同时内置web server和XML-RPC Interface,轻松实现进程管理。

Supervisorctl: 管理client,用户经过命令行发送消息给supervisord,能够查看进程状态,加载配置文件,启停进程,查看进程标准输出和错误输出,远程操做等。

Web server: superviosr提供了web server功能,可经过web控制进程。

XML-RPC interface XML-RPC接口,提供XML-RPC服务来对子进程进行管理,监控

安装部署

为了统一python版本和各类依赖库,推荐使用pyrun代替系统的python进行部署,同时须要在pyrun安装pip,将安装包下载至pkg目录,执行以下命令:

/data/pyrun/bin/pip install --no-index -f pkg meld3==1.0.0

/data/pyrun/bin/pip install --no-index -f pkg elementtree==1.2.6-20050316

/data/pyrun/bin/pip install --no-index -f pkg supervisor==3.2.0

若是机器没法联网,能够源码安装:

1) 依赖 python,可将python版本升级

2) 须要第三方包 meld3setuptoolsElementTree

setuptools (latest) from http://pypi.python.org/pypi/setuptools.

meld3 (latest) from http://www.plope.com/software/meld3/.

elementtree (latest) from http://effbot.org/downloads#elementtree.

3) root解压相关包,批量安装。

配置

Supervisor 的配置文件命名为 supervisord.conf,它为 supervisord(Supervisor 的主服务命令) 和 supervisorctl(Supervisor 的监控管理命令) 提供配置选项设置。 Supervisor 并不规定配置文件 supervisord.conf 的存放位置,Supervisor 服务启动的时候默认会在:

  • $CWD/supervisord.conf
  • $CWD/etc/supervisord.conf
  • /etc/supervisord.conf

这几个目录位置查找配置文件 supervisord.conf。

Supervisor 也提供参数 "-c" 来指定配置文件的目录路径。
在终端输入 "echo_supervisord_conf" 命令可查看 Supervisor 的默认配置的内容。

生成一份默认的配置文件:

echo_supervisord_conf > /etc/supervisord.conf

supervisor配置比较简单,如下几个配置项知足基本的需求,更多配置项请参考官方配置说明

[supervisord]
nodeamon = false #以deamon方式启动进程

[supervisorctl] #使用系统默认配置项

[inet_http_server] #web管理页面的端口和用户密码
port = 8080

username = user

password = pwd

[rpcinterface:supervisor] #xml-rpc接口相关配置
supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface

[program:mongodb]

command=/data1/mongodb_2.4.7_build/mongod -config /data1/mongodbrs/config/mongodb.conf --directoryperdb --quiet --profile 1 --slowms 1000 --noprealloc --shardsvr

directory=/data1/mongodb_2.4.7_build

autostart=false

user=root

注意默认配置文件的最后几行

你能够在supervisord.conf文件相同目录下supervisord.d目录内添加.ini文件分开配置

[include]

files = supervisord.d/*.ini

注意:被监控的进程要以非daemon方式运行,以mongodb为例,须要去掉mongodb进程启动命令里的--fork 参数

使用

#   启动supervisor

   python /usr/bin/supervisord

#  启动监控的进程

    supervisorctl start all

#  关闭监控的进程

      supervisorctl stop all

#  查看状态

      supervisorctl status

# 从新加载配置文件:

supervisorctl reload

其实,能够经过supervisorctl打开supervisor的命令行控制台,而后输入help能够查看看用的命令,而后help+命令能够查看每一个命令的具体功能

 web控制

在 supervisord.conf中配置[inet_http_server],

[inet_http_server]

port = 0.0.0.0:8080 #IP和绑定端口

username = admin #管理员名称

password = 123456 #管理员密码

这样,在浏览器中输入配置中写的地址和端口号,输入配置好的用户名和密码,即可以看到基于网页的控制台界面。从中,能够察看supervisor监控的>信息,能够察看进程的日志等。

浏览器访问:http://10.14.4.84:8080/,(这里的IP为部署supervisor的IP)
clip_image002[4]

8、监控告警

若是需求只是自动拉起crash的进程,经过命令行对进程进行管理,以上内容足矣。supervisor 3.0版本引入了事件,利用这个特性咱们实现实时监控进程状态并告警。

首先了解一下supervisor提供的事件,supervisor经过子进程对应用程序进行管理,监控程序一样做为一个子进程运行,子进程的stdin、stdout、stderr都已经被重定向。事件处理过程以下:

  • 做为监听程序的子进程向stdout写入READY\n
  • 事件发生时,supervisor会选择一个处于Ready状态的子进程的stdin写入事件内容
  • 该子进程事件处理完毕后向stdout写入OK\n或FAIL\n,反馈处理结果
  • 重复上述操做

supervisor提供的多种事件类型,包括:进程状态事件、supervisor状态事件、定时事件、xmlrpc调用事件、进程日志事件等等。咱们主要关注进程状态相关事件。supervisor对进程定义了以下状态,每一个状态的切换都会触发相应的事件。

clip_image003[5]

监控程序可使用任何语言编写,只要按照supervisor的协议格式正确的处理事件消息便可。推荐使用python做为监控程序,supervisor提供了一个childutils模块使编写处理程序更简单。

9、延伸阅读

     github上2个基于supervisor二次开发的集中进程管理工具,可在一个页面下管理多台机器的进程。

https://github.com/mlazarov/supervisord-monitor

https://github.com/TAKEALOT/nodervisor

相关文章
相关标签/搜索