zabbix通过orabbix和自定义脚本监控oracle数据库

zabbix通过orabbix和自定义脚本监控oracle数据库

原文地址http://www.iyunv.com/thread-94249-1-1.html

由于公司要上oracle数据库,需要对这个东西惊醒监控,于是去网上淘资料,发现有一个套件orabbix监控oracle的效果还不错,于是拿来试验了一下。orabbix是由JAVA写的一个套件,需要在oracle服务器上面安装JAVA环境才能运行。这里为了简便,可以使用yum -y install java来安装JAVA环境。

安装完java环境之后可以通过下面命令来检测是否安装成功:
[[email protected] ~]# java -version
java version "1.7.0_45"
OpenJDK Runtime Environment (rhel-2.4.3.3.0.1.el6-x86_64 u45-b15)
OpenJDK 64-Bit Server VM (build 24.45-b08, mixed mode)



如我上面这样显示就证明java环境已经安装成功了。

之后,我们就需要在oracle服务器上面安装orabbix套件了,可以去官网下载,目前最新版本是1.2.3,下载地址为: http://www.smartmarmot.com/downloads/orabbix-1.2.3.zip  
下载完之后将其解压到/opt目录下,接下来,需要配置orabbix的配置文件了。先将配置文件的模板复制一份出来,然后开始配置:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
cp orabbix/conf/config.props.sample orabbix/conf/config.props
vi !$
#comma separed list of Zabbix servers
ZabbixServerList=ZabbixServer1
ZabbixServer1.Address=10.6.0.180              #zabbix服务器的IP地址
ZabbixServer1.Port=10051                      #zabbix服务器的监听端口
#pidFile
OrabbixDaemon.PidFile=./logs/orabbix.pid
#frequency of item's refresh
OrabbixDaemon.Sleep=300
#MaxThreadNumber should be >= than the number of your databases
OrabbixDaemon.MaxThreadNumber=100
#put here your databases in a comma separated list
DatabaseList=DB_QM                            #这个名字可以自行命名,但是需要和下面的名字保持一致,并且在zabbixserver上面配置的主机名要和这个保持一致
#Configuration of Connection pool
#if not specified Orabbis is going to use default values (hardcoded)
#Maximum number of active connection inside pool
DatabaseList.MaxActive=10
#The maximum number of milliseconds that the pool will wait
#(when there are no available connections) for a connection to be returned
#before throwing an exception, or <= 0 to wait indefinitely.
DatabaseList.MaxWait=100
DatabaseList.MaxIdle=1
#define here your connection string for each database
DB_QM.Url=jdbc:oracle:thin:@10.6.0.207:1521:test        #orabbix是通过jdbc链接oracle数据库的,orcl指定的是被监控服务器的连接信息(例如采用jdbc的联接方式,服务器地址是10.6.0.207,oracle的端口是1521,test指的是数据库的实例)
DB_QM.User=zabbix                                       #链接oracle数据库的账号密码,这个需要在oracle数据库中配置
DB_QM.Password=123456
#Those values are optionals if not specified Orabbix is going to use the general values
DB_QM.MaxActive=10                                      #删除用不到的多余的配置,保留这些就可以了。
DB_QM.MaxWait=100
DB_QM.MaxIdle=1
DB_QM.QueryListFile=./conf/query.props
#DB2.Url=jdbc:oracle:thin:@server2.domain.example.com:<LISTENER_PORT>:DB2



然后在oracle数据库中创建zabbix用户:

1
2
3
4
5
6
7
8
9
CREATE USER ZABBIX IDENTIFIED BY 123456  DEFAULT TABLESPACE USERS TEMPORARY TABLESPACE TEMP;
     GRANT CONNECT TO ZABBIX;
     GRANT RESOURCE TO ZABBIX;
     ALTER USER ZABBIX DEFAULT ROLE ALL;
     GRANT SELECT ANY TABLE TO ZABBIX;
     GRANT CREATE SESSION TO ZABBIX;
     GRANT SELECT ANY DICTIONARY TO ZABBIX;
     GRANT UNLIMITED TABLESPACE TO ZABBIX;
     GRANT SELECT ANY DICTIONARY TO ZABBIX;



如果是Oracle 11g,则需要添加如下命令
1
2
3
execdbms_network_acl_admin.create_acl(acl => 'resolve.xml',description =>'resolve acl', principal =>'ZABBIX', is_grant => true, privilege =>'resolve');
exec dbms_network_acl_admin.assign_acl(acl=> 'resolve.xml', host =>'*');
commit;



复制orabbix启动文件到etc目录下:

1
2
cp /opt/orabbix/init.d/orabbix/etc/init.d/orabbix
chmod 755 !$



启动orabbix

1
2
3
systemctl start orabbix
chkconfig --add orabbix
chkconfig orabbix on



启动orabbix之后,没有报错,证明启动成功,如果有报错,一般是配置文件的问题,仔细排查一下应该就没问题。
启动之后,还需要安装上zabbix agentd客户端,至于怎样安装agentd客户端在我的另一篇博客中有介绍,这里就不赘述了。传送门在这里

安装完之后,将模板导入到zabbixserver中:
导入模版,模版放置在/opt/orabbix/template下
Orabbix_export_full.xml   全部导入(图表 监控项 触发器)
Orabbix_export_graphs.xml  图表
Orabbix_export_items.xml   监控项
Orabbix_export_triggers.xml 触发器
这里导入所有的模板,导入模版之后,将oracle主机添加进zabbixserver中,如下图所示
 
配置完之后,正常的话就能够监控oracle数据库的信息了。
下面是出图后的效果:
 
本来到这里就结束了,但是前面这些都不是重点,重点是后面同事需求监控oracle数据库的tablespace的使用量,于是,为了实现这个需求,我在原先的模板中进行了修改。,使用自动发现功能实现监控tablespace的使用情况。
首先,需要创建脚本,获取到oracle数据库中的数据,下面是脚本:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
[[email protected] opt]# cat /home/oracle/oracle_cron.sh 
#!/bin/bash
source /home/oracle/.bash_profile
sqlplus -s zabbix/123456  > /tmp/tablespace.log<<EOF
set linesize 140 pagesize 10000
col "Status"   for a10
col "Name"     for a25
col "Type"     for a10
col "Extent"   for a15
col "Size (M)" for a20
col "Used (M)" for a20
col "Used %"   for a20
SELECT d.status "Status", d.tablespace_name "Name", d.contents "Type", d.extent_management "Extent", 
TO_CHAR(NVL(a.bytes / 1024 / 1024, 0),'99,999,990') "Size (M)", 
TO_CHAR(NVL(a.bytes - NVL(f.bytes, 0), 0)/1024/1024,'999,999,999') "Used (M)", 
TO_CHAR(NVL((a.bytes -  NVL(f.bytes, 0)) / a.bytes * 100, 0), '990.00') "Used %" 
FROM sys.dba_tablespaces d, 
(select         tablespace_name, sum(bytes) bytes from dba_data_files
group by tablespace_name) a, (select    tablespace_name, sum(bytes) bytes from dba_free_space group by tablespace_name) f WHERE 
d.tablespace_name = a.tablespace_name(+) AND d.tablespace_name = f.tablespace_name(+) AND NOT 
(d.extent_management like 'LOCAL' AND d.contents like 'TEMPORARY') 
UNION ALL 
SELECT d.status         "Status", d.tablespace_name "Name", d.contents "Type", d.extent_management "Extent", 
TO_CHAR(NVL(a.bytes / 1024 / 1024, 0),'99,999,999') "Size (M)", 
TO_CHAR(NVL(t.bytes,0)/1024/1024,'999,999,999') "Used (M)", 
TO_CHAR(NVL(t.bytes / a.bytes * 100, 0), '990.00') "Used %" FROM sys.dba_tablespaces d, 
(select tablespace_name, sum(bytes) bytes from dba_temp_files group by tablespace_name) a, (select 
tablespace_name, sum(bytes_cached) bytes from v\$temp_extent_pool group by tablespace_name) t WHERE 
d.tablespace_name = a.tablespace_name(+) AND d.tablespace_name = t.tablespace_name(+) AND 
d.extent_management like 'LOCAL' AND d.contents like 'TEMPORARY'
ORDER BY 7;
EOF



通过执行这个脚本可以获取到moracle数据库中的tablespace列表,并输出到/tmp/tablespace.log日志中去,这个执行脚本需要修改属主属组为oracle.oracle,并且需要给于执行权限,在crontab中设置每一分钟执行一次,下面是执行得到的结果:
1
2
3
4
5
6
7
8
9
10
[[email protected] opt]# cat /tmp/tablespace.log 
Status   Name      TypeExtentSize (M)     Used (M)  Used %
---------- ------------------------- ---------- --------------- -------------------- -------------------- --------------------
ONLINE   UNDOTBS1     UNDOLOCAL280       12     4.38
ONLINE   QWERTY     PERMANENTLOCAL 101    10.00
ONLINE   USERS     PERMANENTLOCAL  51    20.00
ONLINE   SYSTEM     PERMANENTLOCAL700      377    53.88
ONLINE   TEMP      TEMPORARYLOCAL 20       11    55.00
ONLINE   SYSAUX     PERMANENTLOCAL550      400    72.78
6 rows selected.



上面就是取出来的数据,既然数据取出来了,那么剩下的要做的就是把数据弄到zabbix中去咯。
下面将使用下面两个脚本来对取出的这些数据进行格式化转换和取值:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
[[email protected] opt]# cat /usr/local/zabbix/scripts/oracle_discovery.sh 
#!/bin/bash
TABLESPACE=`cat /tmp/tablespace.log |awk '{print$2}'|awk 'NR>3{print}'`
COUNT=`echo "$TABLESPACE" |wc -l`
INDEX=0
echo '{"data":['
echo "$TABLESPACE" | while read LINE; do
    echo -n '{"{#TABLENAME}":"'$LINE'"}'
    INDEX=`expr $INDEX + 1`
    if [ $INDEX -lt $COUNT ]; then
        echo ','
    fi
done
echo ']}'



这个脚本的功能是从tablespace.log文件中取出Name那一列,并进行JSON格式化输出(因为zabbix的自动发现功能获取的数据类型是JSON格式的),下面是执行效果:
1
2
3
4
5
6
7
8
9
10
11
[[email protected] opt]# sh /usr/local/zabbix/scripts/oracle_discovery.sh 
{"data":[
{"{#TABLENAME}":"UNDOTBS1"},
{"{#TABLENAME}":"QWERTY"},
{"{#TABLENAME}":"USERS"},
{"{#TABLENAME}":"SYSTEM"},
{"{#TABLENAME}":"TEMP"},
{"{#TABLENAME}":"SYSAUX"},
{"{#TABLENAME}":""},
{"{#TABLENAME}":"rows"}]}
[[email protected] opt]#



还有一个脚本是获取tablespace.log中的最后三列数据,脚本内容如下:

1
2
3
4
5
6
7
8
9
10
11
12
[[email protected] opt]# cat /usr/local/zabbix/scripts/oracle_check.sh
#!/bin/bash
EQ_DATA="$2"
ZBX_REQ_DATA_TAB="$1"
SOURCE_DATA=/tmp/tablespace.log
case $2 in
  maxmb)        grep -E "$ZBX_REQ_DATA_TAB" $SOURCE_DATA |awk '{print $5*1024*1024}';;
  used)   grep -E "$ZBX_REQ_DATA_TAB" $SOURCE_DATA |awk '{print $6*1024*1024}';;
  autopercent)  grep -E "$ZBX_REQ_DATA_TAB" $SOURCE_DATA |awk '{print $7}';;
  *) echo $ERROR_WRONG_PARAM; exit 1;;
esac
exit 0



其中maxmb和used取出的值是M,所以这里给转换成了byte,方便zabbix取值,下面是举例取出来的值:
1
2
3
[[email protected] opt]# sh /usr/local/zabbix/scripts/oracle_check.sh SYSAUX maxmb
576716800
[[email protected] opt]#



这里配置完成之后就需要在zabbixagentd的配置文件中添加监控key了:

1
2
3
[[email protected] opt]# tail -3 /usr/local/zabbix/etc/zabbix_agentd.conf
UserParameter=ora.tab.discovery,/usr/local/zabbix/scripts/oracle_discovery.sh
UserParameter=tablespace ,/usr/local/zabbix/scripts/oracle_check.sh $1 $2



添加key之后需要重启zabbix agentd服务。
然后我们就需要在zabbixserver中添加监控模板了,首先创建一个发现规则:
 
其中的键值ora.tab.discovery就是我们在agentd的配置文件中定义的,由这个发现规则获取到的是一个JSON格式的返回值。要注意其中的数据更新间隔,这个值指的是你的发现规则执行的时间间隔,我这里暂时设置为60s
然后我们开始创建项目原型了,下面是创建的详细内容:
 
按照上面的项目原型依次创建{#TABLENAME}used和{#TABLENAME}autopercent,对应的键值是tablespace[{#TABLENAME},used]和tablespace[{#TABLENAME},autopercent],创建完发现规则后,开始创建图形原型了,下面是图形原型的详细内容:
 
保存完成后,该发现规则就做好了,之后等待大约一分钟之后就可以看到采集到的数据了,这和上面设定的60s的数据更新间隔是一致的。下面是获取到的监控tablespace的结果:
 
好了,监控tablespace的目标暂时实现了,具体的一些细节还有待改进。附件中将会附上我的根据官网模板修改后的模板,好了,结束了,希望该教程能够帮助到大家!
百度云附件:修改后的orabbix模板.xml