05: zabbix 监控配置

 目录:zabbix其余篇

01: 安装zabbix serverphp

02:zabbix-agent安装配置 及 web界面管理html

03: zabbix API接口 对 主机、主机组、模板、应用集、监控项、触发器等增删改查java

04:获取zabbix监控信息node

05:zabbix 监控配置linux

目录:

1.1 zabbix监控基本介绍     返回顶部

    参考博客:http://www.javashuo.com/article/p-doavkwoy-hp.htmlweb

  一、Zabbix的监控流程数据库

      1. 数据采集:Zabbix经过SNMP、Agent、ICMP、SSH、IPMI等进行数据采集vim

      2. 数据存储:Zabbix存储在MySQL上,也能够存储在其余数据库微信

      3. 数据展现:web界面展现、(移动APP、java_php开发一个web界面也能够)工具

      4. 数据报警:邮件报警、微信报警、短信报警、报警升级机制

   二、Zabbix的监控配置流程

      1. 1)Host groups(主机组)→2)Hosts(主机)→3)template(模板)→

      2. 4)Applications(监控项组)→5)Items(监控项)→

      3. 6)graph(图形) →7)screen (图形分组)→

      4. 8)Triggers(触发器)→9)Event(事件)→10)Actions(处理动做)→

      5. 11)Media types(告警升级|1.执行远程命令2.发送告警邮件)→

      6. 12)User groups(用户组)→13)Users(用户)→14)Medias(告警邮件)

1.2 添加主机组     返回顶部

  一、主机组说明(对同一属性的主机或模板,尽可能概括到分组)

      1. 以地理位置进行划分。

      2. 以业务为单位划分组。

      3. 以机器用途划分。

      4. 以系统版本划分。

      5. 以应用程序分组。

  二、配置→主机组→建立主机组(建立主机组 Test group)

       

1.3 添加模板     返回顶部

   一、模板说明

      1. 监控项、触发器、图形、Web、Discovery等都是存在于主机之上的

      2. 因为多个主机都会用相同的监控配置,所以,能够对这部分同类的数据进行概括抽象,即将这些数据作成模板。

      3. 当咱们须要对其余监控数据进行配置的时候,只须要对相对应的主句添加对应的模板便可。

   二、配置→模板→建立模板

       

  三、填写模板信息

       

  4. 模板具备继承的功能(将一个模板在另一个模板中使用)

      说明:新建的模板若是继承了 Template OS linux 模板后,就会拥有其全部功能

      

   五、新建宏

      1. 宏主要是对变量定义,设置宏的做用是方便后面再Items、Trigger中引用

      2. 在模板中配置一个宏,在不一样的主机对该宏设置不一样的变量值,从而达到模板通用的目的

1.4 建立主机      返回顶部

  一、配置→主机组→建立主机

      

  二、配置主机使用的监控模板

      

1.5 建立应用集     返回顶部

  一、应用集说明

      1. 应用集通常配合监控项使用,它至关于多个同类型的监控项的分类目录,方便查找而已

      2. 应用集通常关联指定模板(只有应用此模板的主机才有此应用集),也能够将应用集关联指定主机(某个独有应用集)

  二、为指定模板建立应用集(法1)

      配置→模板→应用集(找到要建立应用集的模板)→建立应用集

  三、为指定主机建立应用集(法2)

      配置→主机→应用集(找到要建立应用集的主机)→建立应用集

  注:建立监控项时能够对这里建立的应用集进行选择

1.6 建立监控项     返回顶部

  一、监控项说明

      1. 监控项(iterm)就是你要监控的指标,好比cpu利用率,cpu负载,内存使用率等等。

      2. 监控项通常关联指定模板(只有应用此模板的主机才有此监控项),也能够将监控项关联指定主机(某个独有监控项)

      3. 监控项是Zabbix中得到数据的基础。没有监控项,就没有数据——由于一个主机中只有监控项定义了单一的指标或者须要得到的数据。

  二、在 zabbix-agent端/etc/zabbix/zabbix_agentd.d 下建立 base.conf文件 添加 key

    1)在zabbix-agent中建立监控key

[root@linux-node1 /]# cd /etc/zabbix/zabbix_agentd.d
[root@linux-node1 /]# vim base.conf                        # 添加下面这条,统计当前登陆用户数量
UserParameter=log_user, /usr/bin/w|awk 'NR==1{print $6}'

[root@linux-node1 /]# systemctl restart zabbix-agent       # 重启agent

    2)在server上get上面配置key的值(测试是否能够获取结果)

yum -y install zabbix-get                         # 在server安装zabbix-get工具(若是按照失败使用清华源安装)
rpm -ivh https://mirrors.tuna.tsinghua.edu.cn/zabbix/zabbix/3.4/rhel/7/x86_64/zabbix-get-3.4.15-1.el7.x86_64.rpm

zabbix_get -s 192.168.56.11 -p10050 -k log_user   # 在server端运行命令测试是否能够获取到

  三、为指定模板配置监控项

    配置模板监控项(须要添加监控项的模板)→建立监控项

    

1.7 建立Triggers(触发器)      返回顶部

  一、触发器说明

      1. 监控项只是用于收集数据。若是须要自动评估收到的数据,咱们则须要定义触发器。
      2. 触发器包含了一个表达式,这个表达式定义了数据的可接受的阈值级别
      3.若是收到的数据超过了这个定义好的级别,触发器将被“触发”,让咱们知道有问题发生。
      4. 若是数据再次恢复到合理的范围,触发器将会到“正常(Ok)”状态。

  二、添加触发器

      配置模板→触发器(为刚刚模板中的监控添加触发器)→建立触发器

      

 

      

1.8 添加Media(添加发送邮件帐户信息)     返回顶部

  一、建立报警媒介

      管理报警媒介类型→建立媒体类型

      

  二、添加发送邮件的默认用户

       

1.9 添加接收报警邮件人员信息(这里之内置admin用于为例)     返回顶部

  一、添加接收邮件人员信息

      管理→用户→找到对应人员

      

  二、填写接收人信息

      1)第一步

      

       2)第二步

       

1.10 配置action      返回顶部

  一、建立action(发送报警信息)

      管理→动做→建立动做

      

      1)建立 action:动做

      

      2)建立 action:操做(触发报警时操做)

        一、触发器事件成立后有如下两种动做。

            1. 发送消息(send message)

            2. 执行远程命令(Remote command)

        二、当出现了Trigger状态改变时,应尝试自愈,若是没法修复,那么报警升级发送消息通知相关人员

            1. 第一梯度:1-2步,远程执行命令重启Apache,间隔时间为60s,发送执行2次直到故障恢复。

            2. 第二梯度:3-4步,发送给Admin用户,间隔时间为60s,发送两次,直到故障恢复。

        3. 首先要支持远程执行命令,必须开启远程执行命令,以及sudo权限

[root@linux-node2 ~]# vim /etc/zabbix/zabbix_agentd.conf
EnableRemoteCommands=1

[root@linux-node2 zabbix_agentd.d]# systemctl restart zabbix-agent
[root@linux-node2 ~]# visudo
zabbix      ALL=NOPASSWD: /usr/bin/systemctl restart httpd

         4.  第一梯度:1-2步,远程执行命令重启Apache

           

         5.   第二梯度:3-4步,发送给Admin用户,间隔时间为60s,发送两次,直到故障恢复。

                     

      3)建立 action:恢复操做(同上)

1.11 查看报警信息     返回顶部

  一、查看报警信息

      

  二、邮件中收到报警信息以下图

      

相关文章
相关标签/搜索