因为各类缘由,mysql主从架构常常会出现数据不一致的状况出现,大体归结为以下几类mysql
1:备库写数据 sql
2:执行non-deterministic query 数据库
3:回滚掺琐事务表和非事务表的事务架构
4:binlog或者relay log数据损坏ide
数据不一样步给应用带来的危害是致命的,当出现主从数据不一致的状况,常见的应对方法是先把从库下线,而后找个半夜三更的时间把应用停掉,从新执行同步,若是数据库的体积十分庞大,那工做量可想而知,会让人崩溃。本文介绍使用percona-toolkit工具对mysql主从数据库的同步状态进行检查和从新同步。函数
一:安装percona-toolkit工具
# yum -y install perl-Time-HiRes # wget http://www.percona.com/downloads/percona-toolkit/2.2.13/tarball/percona-toolkit-2.2.13.tar.gz # tar -zxvpf percona-toolkit-2.2.13.tar.gz # cd percona-toolkit-2.2.13 # perl Makefile.PL # make # make install
二:修改mysql 的binlog格式binlog_format参数为row格式
性能
mysql binlog日志有三种格式,分别为Statement, Mixed,以及ROW!测试
1.Statement:优化
每一条会修改数据的sql都会记录在binlog中。
优势:不须要记录每一行的变化,减小了binlog日志量,节约了IO,提升性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL状况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,可是考虑到若是带条件的update操做,以及整表删除,alter表等操做,ROW格式会产生大量日志,所以在考虑是否使用ROW格式日志时应该跟据应用的实际状况,其所产生的日志量会增长多少,以及带来的IO性能问题。)
缺点:因为记录的只是执行语句,为了这些语句能在slave上正确运行,所以还必须记录每条语句在执行的时候的一些相关信息,以保证全部语句能在slave获得和在master端执行时候相同 的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有不少相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).
2.Row
不记录sql语句上下文相关信息,仅保存哪条记录被修改。
优势: binlog中能够不记录执行的sql语句的上下文相关的信息,仅须要记录那一条记录被修改为什么了。因此rowlevel的日志内容会很是清楚的记录下每一行数据修改的细节。并且不会出现某些特定状况下的存储过程,或function,以及trigger的调用和触发没法被正确复制的问题
缺点:全部的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,好比一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样形成binlog日志量会很大,特别是当执行alter table之类的语句的时候,因为表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。
3.Mixed
是以上两种level的混合使用,通常的语句修改使用statment格式保存binlog,如一些函数,statement没法完成主从复制的操做,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被作了优化,并非全部的修改都会以row level来记录,像遇到表结构变动的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,仍是会记录全部行的变动。
主从数据库分别修改my.cnf文件相关配置项以下:
binlog_format=ROW
三:使用pt-table-checksum工具检查数据一致性状况
用法参考:
假设192.168.1.205是主库,192.168.1.207是它的从库,端口在3306。
1. 先校验
# pt-table-checksum --user=root --password=123456 \ --host=192.168.1.205 --port=3306 \ --databases=test --tables=t2 --recursion-method=processlist \ --no-check-binlog-format --nocheck-replication-filters \ --replicate=test.checksums
2. 根据校验结果,只修复192.168.1.207从库与主库不一致的地方:
# pt-table-sync --execute --replicate \ test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456
3. 修复后,再从新校验一次。执行第一步的语句便可。
4. 检查修复结果: 登录到192.168.1.207,执行以下sql语句返回若为空,则说明修复成功:
SELECT * FROM test.checksums WHERE master_cnt <> this_cnt OR master_crc <> this_crc OR ISNULL(master_crc) <> ISNULL(this_crc)
各参数含义
--nocheck-replication-filters:不检查复制过滤器,建议启用。后面能够用--databases来指定须要检查的数据库。
--no-check-binlog-format:不检查复制的binlog模式,要是binlog模式是ROW,则会报错。
--replicate-check-only:只显示不一样步的信息。
--replicate=:把checksum的信息写入到指定表中,建议直接写到被检查的数据库当中。
--databases=:指定须要被检查的数据库,多个则用逗号隔开。
--tables=:指定须要被检查的表,多个用逗号隔开
h=127.0.0.1:Master的地址
u=root:用户名
p=123456:密码
P=3306:端口
下面咱们来模拟下主从数据库不一样步状况下的pt-table-checksum,为了方面,这里咱们采用test schema
1: 主库上建表,插入测试数据
mysql> create table t2 (id int primary key,name varchar(100) not null,salary int); mysql> CREATE PROCEDURE test_insert () BEGIN DECLARE i INT DEFAULT 0; WHILE i<10000 DO INSERT INTO t2 VALUES (i,CONCAT('员工',i), i); SET i=i+1; END WHILE ; END;; mysql> CALL test_insert();
从库上校验当前数据的同步状况为正常。
从库上删除一半的数据
mysql> delete from t2 where id > 5000; Query OK, 4999 rows affected (0.14 sec) mysql> select count(*) from t2; +----------+ | count(*) | +----------+ | 5001 | +----------+ 1 row in set (0.01 sec)
2:使用pt-table-checksum工具进行校验:
# pt-table-checksum --user=root --password=123456 \ --host=192.168.1.205 --port=3306 \ --databases=test --tables=t2 --recursion-method=processlist \ --no-check-binlog-format --nocheck-replication-filters \ --replicate=test.checksums
3:登录从库进行查询checksum表
mysql> SELECT * FROM test.checksums WHERE master_cnt <> this_cnt OR master_crc <> this_crc OR ISNULL(master_crc) <> ISNULL(this_crc)
4:使用pt-table-sync工具进行数据从新同步
# pt-table-sync --execute --replicate \ test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456
5:从库上验证数据,中文“员工”变成了“??”
检查主库,发现出现同样的状况,中文“员工”变成了“??”,猜测和字符集设置相关。
因而检查数据库字符集设置,发现test库字符集非utf8
主从库my.cnf文件添加以下配置项后重启数据库实例
character_set_client=utf8 character_set_server=utf8
从新执行以上1-4步,发现一切正常!关键第4步要加--charset=utf8 参数
# pt-table-sync --execute --replicate \ test.checksums --charset=utf8 \ --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456