linux下mrtg,cacti,nagios,ganglia的搭建和win/linux主机等的监控。

在51cto作的监控沙龙的ppt,给你们整理成word文档了,这样能够方便你们阅读,也能够方便你们复制里面的命令,但愿你们多给给评论,不要看看就走了!!!!php

沙龙的讲座内容:html

  1. 监控软件mrtg
  2. 监控软件cacti
  3. 监控软件nagios
  4. 监控软件ganglia

第一款监控软件Mrtgmysql

mrtg这款软件是在互联网应用的比较早的监控软件,像在05,06年的时候,它是很是吃香的。它的原理比较简单:经过snmp与被管设备通讯,把数据取回来,而后生成图片,直接显示出来,不须要把数据写到数据库里面,很是简洁,若是单纯想监控主机/路由器/交换机等设备的接口流量的话,mrtg是首选的监控软件。下面是监控图linux

clip_p_w_picpath002

搭建步骤:ios

一.前提条件:web

系统必须已经安装如下软件,这些软件都是光盘里自带的:sql

gd;libpng;perl;gpeg;apache;snmp(也能够安装源码包)。数据库

二.安装mrtg。你们用源码包或者rpm包均可以,在这里我选择用rpm包了,在rhel4之后的版本里面已经把mrtg集成进去了,直接用光盘的rpm包安装就能够了。apache

具体操做:搭建一个本地yum库windows

编辑yum配置文件: vi /etc/yum.repos.d/rhel-debuginfo.repo内容以下:

[rhel-debuginfo]

name=Red Hat Enterprise Linux $releasever - $basearch - Debugbaseurl=file:///mnt/Server

enabled=1

gpgcheck=1

gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release

挂在光盘到/mnt: mount /dev/hdc /mnt

执行yum update 来 升级yum库。

yum -y install 软件名称

三.用mrtg来监控路由器/交换机/服务器的接口流量。

1. cfgmaker --global “WorkDir:/var/www/html” --global “Options[]:growright,bits” --show-op-down --ifref=name --output mrtg.cfg password1@路由器ip password2@服务器ip ….

解释一下:

cfgmaker命令是用来生成mrtg的配置文件的

--global是两个全局配置参数来指定mrtg的工做目录和流量的增加单位

--show-op-down是显示全部接口流量,默认只显示有流量的接口

--ifref=name表示生成的流量图片上方的标题是接口的名称

--output=mrtg.cfg表示mrtg的配置文件的名称

password1@路由器ip,注意@前面是snmp的团体名称,是来作身份验证的,至关于密码,该团体名称要在被管设备上面提起设置好,这个须要你们注意一下。

2. env LANG=C /usr/bin/mrtg mrtg.cfg

这条命令你们应该清楚什么意思吧:把环境变量LANG设置为C(中文chinese),用mrtg命令来处理刚才生成的mrtg的配置文件。注意该命令须要执行3次。

3. indexmaker --output=/var/ww/html/index.html --title=网页标题 /var/www/html/mrtg.cfg

indexmaker是用来生成网页文件的,后面须要指定一下mrtg的配置文件。

4 启动一下apache,而后经过http://搭建mrtg的ip就能够访问到监控内容了

写一个计划任务让它每五分钟执行一次来达到实时监控的目的.

crontab -e

*/5 * * * * env LANG=C /usr/bin/mrtg /var/www/html/mrtg.cfg

注意:A. 若是监控网络设备,必定要提早在设备上开启snmp,不然是监控不到的。

好比:华为或者h3c的设备启用snmp的命令是: snmp-agent community read 共同体名

思科的设备启用snmp的命令是: snmp community 共同体名 ro/rw

B .若是监控windows客户端,windows要安装“简单网络管理协议”(在添加删除程序里面),而后在服务里面就能够找到snmp:如图

给它添加一个团体名称就能够了。

clip_p_w_picpath004

监控linux主机

从RHEL5光盘中安装net-snmp软件包

* 先安装依赖包 lm_sensors-2.10.0-3.1.i386.rpm

* 再安装 net-snmp-5.3.1-14.el5.i386.rpm

调整snmpd.conf配置文件

vi /etc/snmp/snmpd.conf

clip_p_w_picpath006

第二款监控软件cacti

先看一下cacti的原理图:

clip_p_w_picpath012

clip_p_w_picpath014

下面看一下cacti的搭建过程:

配置被监测端

* 要可以支持以SNMP协议提供监测数据

* 对于Linux主机能够安装net-snmp软件包

配置监测服务端

* 安装并配置以Cacti套件为主的各类工具

* 包括AMP平台、SNMP数据采集工具、RRDTool工具

使用Cacti监测系统

* 添加被监测主机或设备

* 设置被监测的具体项目

* 生成及查看监测图像

一.被监控端(一台linux服务器)的操做:在mrtg中已作介绍,这里就省略了

二.服务器端的操做:

安装依赖软件

* AMP平台,从RHEL5光盘中安装下列软件包

yum -y install httpd mysql mysql-server mysql-connector-odbc

yum -y install php php-mysql php-common php-pdo

SNMP数据采集工具

* lm_sensors、net-snmp、net-snmp-utils

* yum -y install lm_sensors net-snmp net-snmp-utils

RRDTool引擎

* 下载软件包:rrdtool-1.2.27.tar.gz

* 配置:./configure --prefix=/usr/local

* 编译安装: make && make install

小提示:期间可能会报错:intltool太老(也可能没安装)

解决方法:yum -y install intltool

安装Cacti程序套件

cacti-0.8.7g.tar.gz -C /var/www/html/

进入/var/www/html/目录:

mv cacti-0.8.7 cacti

useradd cactiuser

chown -R cactiuser.cactiuser cacti/rra/ cacti/log/

启动mysql: service mysqld start

登录 mysql -u root -p

mysql> create database cactidb default character set utf8;

mysql> grant all on cactidb.* to cactiuser@localhost identified by '1234';

mysql> quit

用sql语句导入数据库内容.

[root@localhost html]# mysql -u cactiuser -p cactidb < cacti/cacti.sql

编辑cacti的配置文件/var/www/html/cacti/include/config.php

$database_type = "mysql"; 数据库类型

$database_default = "cactidb"; 数据库名称

$database_hostname = "localhost"; 数据库服务器位置

$database_username = "cactiuser"; 链接数据库的用户

$database_password = "1234"; 该用户的密码

$database_port = "3306"; 数据库端口

修改apache主配文件

DirectoryIndex 后面添加index.php

而后就能够启动apache了: service httpd start

在浏览器里面http://服务器的ip地址 /cacti(用户名和密码均是admin,第一次必须改密码)

clip_p_w_picpath016

clip_p_w_picpath018

clip_p_w_picpath019

如何添加设备

添加设备:ConsoleàDevicesàAdd

须要填写的内容主要是:设备描述 设备ip或主机名 snmp版本 团体名

clip_p_w_picpath021

可以看到snmp information证实添加成功了。

生成图像

添加设备:ConsoleàNewGraphs

而后选择要为哪一个设备生成图像,把右侧要生成图像的内容的勾号都勾选上。

clip_p_w_picpath023

把图像挂载到图像树下面去

clip_p_w_picpath025

若是想生成连续的图像须要写一个计划任务:

*/5 * * * * php /var/www/html/cacti/poller.php

舒适提示:执行这条命令会在/var/www/html/cacti/rra目录下生成不少以rrd结尾的数据文件,若是没有生成,则证实权限设置有问题

Cacti扩展

扩展三个插件monitor,settings,thold

插件的主要做用:

一是邮件报警

二是声音报警

具体操做

* 解压补丁文件 cacti-plugin-0.8.7g-PA-v2.8.tar.gz

* Cd /var/www/html/cacti

* patch -p1 -N &lt; /soft/cacit/cacti-plugin-arch/cacti-plugin-0.8.7g-PA-v2.8.diff

* 注意:补丁文件必须与cacti安装文件版本匹配才能够

* 而后分别把thold-0.3.9.tar.gz;settings-0.5.tar.gz;monitor-0.7.tar.gz解压到 /var/www/html/cacti/plugins目录

这是monitor的内容,有声音报警

clip_p_w_picpath027

这是邮件报警,在console->settings-&gt;mail/dns里面

clip_p_w_picpath029

Cacti-后续扩展,我会继续更新cacti监控里的东西,你们能够多关注个人博客:

http://gehailong.blog.51cto.com

clip_p_w_picpath030

clip_p_w_picpath032

clip_p_w_picpath034

这些内容我后续会在博客里写出来

第三款监控软件nagios

Nagios功能很是强大,它能够监控服务和主机,可是他自身并不包括这部分功能的代码,全部的监控、检测功能都是有插件来完成的。再说报警功能,若是监控系统发现问题不能报警那就没有意义了,因此报警也是nagios很重要的功能之一。可是,nagios自身也没有报警部分的代码,甚至没有插件,而是交给用户或者其余相关开源项目组去完成好比飞信,邮件等实现报警。nagios安装,是指基本平台,也就是nagios软件包的安装。它是监控体系的框架,也是全部监控的基础。

nagios搭建

用户和组的创建:

* 创建 nagios 帐号

* /usr/sbin/useradd nagios

* 建立一个用户组名为 nagcmd 用于从 Web 接口执行外部命令。将 nagios用户和 apache 用户都加到这个组中。

* /usr/sbin/groupadd nagcmd

* /usr/sbin/usermod -G nagcmd nagios

* /usr/sbin/usermod -G nagcmd apache/daemon

安装软件:nagios-3.3.1.tar.gz

主要操做:

* ./configure --with-command-group=nagcmd --prefix=/usr/local/nagios

* make all

* make install

* make install-init

* make install-config

* make install-commandmode

bin

Nagios执行程序的目录

etc

Nagios配置文件位置,初始安装完后,只有几个*.cfg-sample文件 3与2区别 对象配置文件都在etc/objects目录下

sbin

Nagios Cgi文件所在目录,也就是执行外部命令所需文件所在的目录

Share

Nagios网页文件所在的目录

Var

Nagios日志文件、spid 等文件所在的目录

var/archives

Empty directory for the archived logs

var/rw

Empty directory for the external command file

Nagios主配文件nagios.conf简介

* cfg_file=/usr/local/nagios/etc/objects/contacts.cfg //联系人/组配置文件

* cfg_file=/usr/local/nagios/etc/objects/localhost.cfg //本机配置文件

* cfg_file=/usr/local/nagios/etc/objects/timeperiods.cfg //监视时段配置文件

* cfg_file=/usr/local/nagios/etc/objects/commands.cfg //监视脚本配置

* cfg_file=/usr/local/nagios/etc/objects/templates.cfg //监视服务,报警配置

* cfg_file=/usr/local/nagios/etc/objects/switch.cfg //监视路由

* cfg_file=/usr/local/nagios/etc/objects/windows.cfg //监视微软

安装插件: nagios-plugins-1.4.15.tar.gz来扩展nagios的功能

* tar zxvf nagios-plugins-1.4.15.tar.gz

* cd nagios-plugins-1.4.15

* ./configure --with-nagios-user=nagios --with-nagios-group=nagios --prefix=/usr/local/nagios &&make && make install

* chown nagios.nagios /usr/local/nagios

* chown -R nagios.nagios /usr/local/nagios/libexec

验证插件是否安装成功:

* ls /usr/local/nagios/libexec

* 会显示安装的插件文件,即全部的插件都安装在 libexec 这个目录下

clip_p_w_picpath036

监控软件nagios-配置web接口(我介绍的是最简单的方法,不要改apache的配置文件)

直接在nagios 的解压目录下执行一下 make install-webconf

主要做用:在/etc/httpd/conf.d目录下生成nagios.conf

这种配置方式是最简单,最方便的。

* 建立一个 nagiosadmin 的用户用于 Nagios 的 WEB 接口登陆。记下你所设置的登陆口 令,一下子你会用到它。

* htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin

重启apache让刚才生成的配置文件生效: service httpd restart

* 把 Nagios 加入到服务列表中以使之在系统启动时自动启动

* chkconfig --add nagios

* chkconfig nagios on

* 检查Nagios 的配置文件是否有语法错误

* /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

* 这条命令会常常用到要牢记

* 若是没有报错,就能够启动 Nagios 服务

* service nagios start

* 访问http://服务器ip/nagios 输入用户名和口令就能够访问了

clip_p_w_picpath038

监控软件nagios-监控linux

服务器的配置:

1. 安装软件nrpe-2.12.tar.gz

服务器和被监控主机经过nrpe通讯

tar xzvf nrpe-2.12.tar.gz

cd nrpe-2.12

./configure &&make all &&make install-plugin &&make install-daemon &&make install-daemon-config

* 2.在/usr/local/nagios/etc/objects下新建文件hosts.cfg在里面写入以下内容:

* define host {

* name default_servers 定义模板,后面会用

* contact_groups admins 出问题联系哪一个组

* max_check_attempts 5

* notification_interval 0

* notification_period 24x7

* notification_options d,u,r

* check_command check-host-alive

* }

* define host {

* use default_servers 调用上面定义的模板

* host_name db_ip2_back

* alias db_ip2_back

* address 192.168.10.2

* }

* 3.在/usr/local/nagios/etc/objects目录下新建services.cfg。内容以下

* efine service {

* name dbservers 定义模板,后面要用

* max_check_attempts 3

* normal_check_interval 4

* retry_check_interval 2

* check_period 24x7

* notification_interval 15

* notification_period 24x7

* notification_options w,u,c,r

* contact_groups admins 组要在contacts.cfg中提早定义好

* }

* define service{

* use dbservers

* host_name db_ip2_back

* service_description Root Partition

* check_command check_local_disk!20%!10%!/

* }

客户端的配置:

* 新建用户nagios

* 安装nrpe软件。安装方式跟服务器安装方式相同

* 启动nrpe:

* /usr/local/nagios/bin/nrpe -d /usr/local/nagios/etc/nrpe.cfg

* 查看是否启动成功:

* [root@localhost etc]# netstat -ntlp|grep nrpe

* tcp 0 0 0.0.0.0:5666 0.0.0.0:* LISTEN 20086/nrpe

clip_p_w_picpath039

监控软件nagios-监控windows

服务器端的配置:

* 编辑/usr/local/nagios/etc/objects/hosts.cfg在后面添加以下内容

* define host{

* use default_servers

* host_name win_ip3_server

* alias win_ip3_server

* address 192.168.10.3

* }

* 编辑/usr/local/nagios/etc/objects/services.cfg在后面添加以下内容

* define service{

* use generic-service

* host_name win_ip3_server

* service_description Memory Usage

* check_command check_nt!MEMUSE!-w 80 -c 90

* }

* define service{

* use generic-service

* host_name win_ip3_server

* service_description C:\ Drive Space

* check_command check_nt!USEDDISKSPACE!-l c -w 80 -c 90

* }

Windows客户端的配置:

* 1.双击安装NSClient++-0.3.6-Win32.msi

* 2.编辑NES.ini

* 在 [modules] 选项里

* 去掉全部的注释符号; 除了

* CheckWMI.dll和RemoteConfiguration.dll

* 在 [Settings] 选项里

* 修改allowd_host=61.x.x.x(nagios服务器的ip)

* 若是这一步要修改passwd,那么nagios服务器里面commands.cfg也要修改!

* 步骤: 在commands.cfg 找到check_nt 定义命令 中的 Command_line 在其中添加-s 你的密码

* 在[NSClient] 里面,去掉port=12489的注释!

* 他靠端口12489侦听,因此防火墙要打开这个端口!

* 而后双击nstray.exe启动nsclient

clip_p_w_picpath040

实现飞信报警

安装飞信:

把飞信安装到/usr/local/nagios/sms目录。

* tar xzvf fetion20090406003-linux.tar.gz -C /usr/local/nagios/sms/

* cd /usr/local/nagios/sms/install

* mv * ../

* 运行飞信会报错: /usr/local/nagios/sms/fetion

* ./fetion: error while loading shared libraries: libACE-5.6.8.so: cannot open shared object file: No such file or director

* 解决方法:

* tar xzvf library_linux.tar.gz -C /usr/lib

测试飞信:

* ./fetion --mobile=手机号 --pwd=密码 --msg-utf8="test" --to=13671324197

* 编辑commands.cfg在后面添加以下内容

* define command{

* command_name notify-service-by-sms

* command_line /usr/local/nagios/sms/fetion --mobile=13716335947 --pwd=fantong_2010 --msg-type=1 --msg-utf8="$HOSTNAME$ $SERVICEDESC$ is $SERVICESTATE$ on $TIME$ result is $SERVICEOUTPUT$" --to=$CONTACTPAGER$

* 编辑 contacts.cfg,添加以下内容

* define contact {

* contact_name nagiosadmin

* alias nagiosadmin

* service_notification_period 24x7

* host_notification_period 24x7

* service_notification_options w,u,c,r

* host_notification_options d,u,r

* service_notification_commands notify-service-by-email,notify-service-by-sms

* host_notification_commands notify-host-by-email,notify-host-by-sms

* email search-alert@fantong.com,gehailong@fantong.com

* pager 13671324197

* }

* define contactgroup{

* contactgroup_name admins

* alias Nagios Administrators

* members nagiosadmin

* }

后续扩展,后续我会吧一下nagios的高级应用加到博客里去

clip_p_w_picpath042

clip_p_w_picpath044

Ganglia这个软件我在我博客已经有了,这里我就省略了。。。

欢迎你们多发表评论啊!!!!!!

你们能够去http://down.51cto.com/765312这里下载该文档