Mysql 主从延时监控

介绍

主从延时在主从环境中是一个很是值得关注的问题,有时候咱们能够经过show slave status命令查看Seconds_Behind_Master值来分析主从的延时状况;可是因为该值是来自binlog文件语句的完成时间,当一条SQL执行时间很长的时候那么该值可能就不许确了,那么有没有什么工具能够很准确的分析主从的延时状况呢? 在PT系列工具里面的pt-heartbeat工具很好的解决了这个问题。mysql

 

原理sql

pt工具在主库上面建立一张测试表,以一秒的频率去更新这个的记录并把当前时间写入到字段中,经过分析主从同步过来的时间和当前时间作对比得出时间差。shell

 

方法数据库

 1.在主库上建立后台update进程express

pt-heartbeat -uroot -proot  -D chenmh --create-table --update  --daemonize

-u:链接主库的用户服务器

-p:链接主库的用户密码socket

-D:主库上存在的数据库,这个数据库随便指定,可是必须存在工具

--create-table:默认会在主库指定的数据库中建立一个“heartbeat”表测试

 

2.监控从库this

pt-heartbeat -uroot -proot -D chenmh --table=heartbeat --master-server-id=10  --monitor -h 192.168.137.20 --interval=1 

这里面的参数除了--master-server-id是主库的serverid,其它的都是指从库,特别注意--master-server-id必定不能写错不然结果就是错误的,记录了日志以后就能够对该值作监控预警了

3.写入监控日志作预警分析

pt-heartbeat -uroot -proot -D chenmh --table=heartbeat --master-server-id=10  --monitor -h 192.168.137.20 --interval=1  --file=/tmp/heart.log
cat /tmp/heart.log |awk -F "s"  '{print $1}'

 4.中止后台更新操做

pt-heartbeat --stop

 当你中止了后台更新进程会在/tmp目录下面产生一个pt-heartbeat-sentinel文件,下次再启动该后台进程以前必须先删除该文件,不然没法启动。

rm -rf /tmp/pt-heartbeat-sentinel

 

参数

Usage: pt-heartbeat [OPTIONS] [DSN] --update|--monitor|--check|--stop
其中--update, --moniter,--check,--stop都是单独使用的,而且--update, --monitor, and --check are mutually exclusive
--daemonize and --check are mutually exclusive.他们之间仍是存在互斥。
Options:

  --ask-pass                  使用密码进行mysql链接时给予提示
--charset=s -A 默认的字符选项 --check 执行一次从库的监控就结束 --check-read-only 若是是只读的服务器那么使用该选项会保持插入
--config=A 使用逗号分隔,若是指定了,那么该参数做为命令行的第一个选项
--create-table 若是表不存在建立表heartbeat
--daemonize 建立后台的更新shell
--database=s -D 指定链接的数据库
--dbi-driver=s Specify a driver for the connection; mysql and Pg are supported (default mysql) --defaults-file=s -F 经过提供的文件进行mysql链接
--file=s 输出最新的 --monitor监控信息到指定的文件
--frames=s 设置时间周期(default 1m,5m,15m) --help 显示帮助信息 --host=s -h 指定链接的host --[no]insert-heartbeat-row 在使用--tables的时候默认是插入一条记录到表heartbeat前提是表中不存在该记录行 --interval=f 指定更新和监控heartbeat表的频率默认是1S
--log=s 当使用daemonized进行后台更新操做时输出全部的信息到指定的该文件 --master-server-id=s 指定主的server-id
--monitor 监控从服务器的参数选项 --password=s -p 指定密码 --pid=s 建立pid文件 --port=i -P 指定链接时使用的端口
--print-master-server-id 打印输出master-server-id
--recurse=i Check slaves recursively to this depth in --check mode --recursion-method=a Preferred recursion method used to find slaves ( default processlist,hosts) --replace 使用replace替换--UPDATE操做
--run-time=m 指定监控的时长,单位有: s=seconds, m=minutes, h=hours, d=days; 若是比指定默认是以秒为单位一直监控下去
--sentinel=s Exit if this file exists (default /tmp/pt- heartbeat-sentinel) --set-vars=A Set the MySQL variables in this comma-separated list of variable=value pairs --skew=f 指定执行从库检查的延时时长默认是0.5
--socket=s -S 指定链接时使用的socket文件
--stop 中止后台更新进程并生成--sentinel指定的文件 --table=s 指定更新的表(默认是heartbeat) --update 更新主的heartbeat表,这个参数是后台进程必须的参数也能够用--replace替代 --user=s -u 指定用户名
--utc 忽略系统时间仅使用UTC --version 显示版本信息 --[no]version-check Check for the latest version of Percona Toolkit, MySQL, and other programs (default yes)

 

总结

 能够经过这个监控的输出文件信息作一个邮件报警,有兴趣能够去写这样的一个shell

 

 

 

备注:

    做者:pursuer.chen

    博客:http://www.cnblogs.com/chenmh

本站点全部随笔都是原创,欢迎你们转载;但转载时必须注明文章来源,且在文章开头明显处给明连接。

《欢迎交流讨论》

相关文章
相关标签/搜索