MySQL-5.6版本GTID的主从复制

时间 2019-11-13

标签 mysql 5.6 版本 gtid 主从复制栏目 MySQL 繁體版

原文原文链接

mysql GTID Replicationmysql

1、GTID的概述：git

一、全局事物标识：global transaction identifieds。sql

二、GTID事物是全局惟一性的，且一个事务对应一个GTID。数据库

三、一个GTID在一个服务器上只执行一次，避免重复执行致使数据混乱或者主从不一致。安全

四、GTID用来代替classic的复制方法，不在使用binlog+pos开启复制。而是使用master_auto_postion=1的方式自动匹配GTID断点进行复制。服务器

五、MySQL-5.6.5开始支持的，MySQL-5.6.10后开始完善。session

六、在传统的slave端，binlog是不用开启的，可是在GTID中，slave端的binlog是必须开启的，目的是记录执行过的GTID（强制）。多线程

2、GTID的组成部分：ide

前面是server_uuid：后面是一个序列号post

例如：server_uuid：sequence number

7800a22c-95ae-11e4-983d-080027de205a:10

UUID：每一个mysql实例的惟一ID，因为会传递到slave，因此也能够理解为源ID。

Sequence number：在每台MySQL服务器上都是从1开始自增加的序列，一个数值对应一个事务。

3、GTID比传统复制的优点：

一、更简单的实现failover，不用之前那样在须要找log_file和log_Pos。

二、更简单的搭建主从复制。

三、比传统复制更加安全。

四、GTID是连续没有空洞的，所以主从库出现数据冲突时，能够用添加空事物的方式进行跳过。

4、GTID的工做原理：

一、master更新数据时，会在事务前产生GTID，一同记录到binlog日志中。

二、slave端的i/o 线程将变动的binlog，写入到本地的relay log中。

三、sql线程从relay log中获取GTID，而后对比slave端的binlog是否有记录。

四、若是有记录，说明该GTID的事务已经执行，slave会忽略。

五、若是没有记录，slave就会从relay log中执行该GTID的事务，并记录到binlog。

六、在解析过程当中会判断是否有主键，若是没有就用二级索引，若是没有就用所有扫描。

要点：

一、slave在接受master的binlog时，会校验master的GTID是否已经执行过（一个服务器只能执行一次）。

二、为了保证主从数据的一致性，多线程只能同时执行一个GTID。

6、使用GTID搭建mysql的主从复制的主要参数：

[mysqld]

#GTID:

gtid_mode=on

enforce_gtid_consistency=on

server_id=2003306 #天天实例的server_id都要不同

#binlog

log-bin=mysqlbin

log-slave-updates=1 #容许下端接入slave

binlog_format=row #强烈建议，其余格式可能形成数据不一致

#relay log

skip_slave_start=1

注意：建议使用mysql-5.6.5以上的最新版本。

（二）、启动GTID的两种方法：

方法1、

一、若是是在已经跑的服务器，你须要重启一下mysql server。

二、启动以前，必定要先关闭master的写入，保证全部slave端都已经和master端数据保持同步。

三、全部slave须要加上skip_slave_start=1的配置参数，避免启动后仍是使用老的复制协议。

方法2、

一、若是是新搭建的服务器，直接启动就好了。

7、master-slave搭建的注意事项：

（一）、使用GTID的方式，把salve端挂载master端：

一、启动之后最好不要当即执行事务，而是先change master上。

二、而后在执行事务，固然知不是必须的。

三、使用下面的sql切换slave到新的master。

stop slave;

change master to

master_host = 192.168.100.200,

master_port = 3306,

master_user = abobo,

master_password=123,

master_auto_position = 1;

(二)、若是给已经运行的GTID的master端添加一个新的slave

有两种方法：

方法1、适用于master也是新建不久的状况。

一、若是你的master全部的binlog还在。能够选择相似于上面的方法，安装slave，直接change master to到master端。

二、原理是直接获取master全部的GTID并执行。

三、优势：简单方便。

四、缺点：若是binlog太多，数据彻底同步须要时间较长，而且master一开始就启用了GTUD。

方法2、适用于拥有较大数据的状况。（推荐）

一、经过master或者其余slave的备份搭建新的slave。（看第三部分）

二、原理：获取master的数据和这些数据对应的GTID范围，而后经过slave设置@@global.gtid_purged跳过备份包含的gtid。

三、优势：是能够避免第一种方法的不足。

四、缺点：相对来讲有点复杂。

（三）、经过备份搭建新的slave：（方法二的扩展）

两种方法：

方法1、mysqldump的方式：

一、在备份的时候指定--master-data=2（来保存binlog的文件号和位置的命令）。

二、使用mysqldump的命令在dump文件里能够看到下面两个信息：

SET @@SESSION.SQL_LOG_BIN=0;

SET @@GLOBAL.GTID_PURGED='7800a22c-95ae-11e4-983d-080027de205a:1-8';

三、将备份还原到slave后，使用change master to命令挂载master端。

注意：在mysql5.6.9之后的命令才支持这个功能。

方法2、percona Xtrabackup

一、Xtrabackup_binlog_info文件中，包含global.gtid_purged='XXXXXX:XXXX'的信息。

二、而后到slave去手工的 SET GLOBAL.GTID_PURGED='XXXXXX:XXXX'。

三、恢复备份，开启change master to 命令。

注意：若是系统运行了好久，没法找到GTID的变好了，能够经过上面的方式进行查找。

8、GTID如何跳过事务冲突：

一、这个功能主要跳过事务，代替原来的set global sql_slave_skip_counter = 1。

二、因为在这个GTID必须是连续的，正常状况同一个服务器产生的GTID是不会存在空缺的。因此不能简单的skip掉一个事务，只能经过注入空事物的方法替换掉一个实际操做事务。

三、注入空事物的方法：

stop slave;

set gtid_next='xxxxxxx:N';

begin;commit;

set gtid_next='AUTOMAIC';

start slave;

四、这里的xxxxx:N 也就是你的slave sql thread报错的GTID，或者说是你想要跳过的GTID。

9、GTID的参数注释：

[master]>show global variables like '%gtid%';

一、enforce_gtid_consistency：开启gtid的一些安全限制（介意开启）。

二、gtid_executed：全局和seeeion级别均可以用。用来保存已经执行过的GTIDs。

贴士：show master status\G;输出结果中的Executed_Gtid_Set和gitd_executed一致。reset master时，此值会被清空。

三、gtid_owned：全局和session级别均可用，全局表示全部服务器拥有GTIDs ，session级别表示当前client拥有全部GTIDs。（此功能用的少）

四、gtid_mode：是否开启GTID功能。

五、gtid_purged：全局参数，设置在binlog中，已经purged的GTIDs，而且purged掉的GTIDs会包含到gtid_executed中。

贴士：从而致使slave不会再去master请求这些GTIDs，而且Executed_Gtid_Set为空时，才能够设置此值。

六、gtid_next：这个时session级别的参数：

[master]>show session variables like '%gtid_next%';

10、关于GTID的一些功能限制：

（一）、更新非事务引擎：

一、Case重现：

master：对一个innodb表作一个多sql更新的事物，效果是产生一个GTID。

slave：对应的表是MYISAM引擎，执行这个GTID的第一个语句后就会报错，由于非事务引擎一个sql就是一个事务。

二、错误编号：

last_Errno:1756

三、异常恢复方案：

（1）、简单的stop slave; start slave;就可以忽略错误。可是这个时候主从的一致性已经出现问题。须要手工的把slave差的数据补上。

（2）、首先将引擎调整为同样的，slave也改成事务引擎。

（二）、create table ....select statements

一、case重现：

master：直接执行一个create table select * from table;的sql

二、报错：

error 1786

三、原理：

因为create table ...select语句会生成两个sql，一个是DDL建立表SQL，一个是insert into 插入数据的sql。因为DDL会致使自动提交，因此这个sql至少须要两个GTID，可是GTID模式下，只能给这个sql生成一个GTID，若是强制执行会致使和上面更新非事务引擎同样的结果。

（三）、一个sql同事操做innodb引擎和myisam引擎：

case重现：t1表是innodb，t2表是myisam

一、update t1,t2 set t1.id=1000,t2.id=1000 where t1.id=t2.id;

二、报错：1785

三、原理和第二个相同。

（四）、在一个replication grouop 中，全部的mysql必需要统一开启或者关闭GTID功能。

一、case重现：

将一个未开启gtid的slave经过原始的binlog和pos方式链接到开启GTID的master。

二、报错：

The slave IO thread stops because the master has @@GLOBAL.GTID_MODE ON and this server has @@GLOBAL.GTID_MODE OFF。

（五）、在一个replication group中，若是开启GTID之后，就再也不容许使用classic的复制方式：

一、case重现：

将一个开启gtid的slave经过原始的binlog和pos方式链接到开启GTID的master。

二、报错：

ERROR 1776(HY000)：Parameters MASTER_LOG_FILE，MASTER_LOG_POS，RELAY_LOG_FILE and RELAY_LOG_POS cannot be set when MASTER_AUTO_POSITION is active。

（六）、GTID_MODE是not online的：

须要重启才能生效，官方暂时不支持平滑的从classic replication切换到GTID replication。

贴士：

因为GTID开启须要重启系统，一个复制组中全部的实例必须统一开启或者关闭GTID,开启GTID之后不能在使用classic复制。

问题：

也就是说在线业务必须统一关闭，而后再启动，会致使服务中断。

解决方案：

一、针对这种状况，社区有两种对应的平滑升级的方案：

一种是booking.com出品，这两个差异在淘宝9月份数据库月报里有说明，加了一个桥接的服务器，既能够运行GTID模式下，也能够运行classic模式下。

另一种是facebook.com出品。全部的slave能够在开启GTID模式的状况下，能够链接到没有开启GTID模式的master。

二、能够关闭一个部分，中止写操做，可是读不用，将另外一部分改为GTID模式。

（七）、Temporary tables。

一、create temporary table和drop temporary table语句同样在GTID环境下不支持。

若是--enforce_gtid_consistency参数开启，而且autocommit=1，那么可使用。

（八）、关于Errant transaction

一、Errant transaction：所谓的errant transaction也就是没有规范的从master执行，而是直接从slave执行的事务。

二、因为GTID协议的缘由，最开始已经提过（参见GTID architecture）。

三、若是slave有errant transaction产生，因为GTID协议中的规则，很容易致使failover失败。主要有两种状况：

a、在slave上作了无用的或者临时的errant transaction操做，若是该slave升级成为master的话，链接到它的全部数据库都会获取到这个事务。若是同样就会产生冲突。

b、因为作了这个errant transaction这个事务之后，其余的slave尚未获取这个errant transaction的GTID，须要从master上发同步给其余的slave，可是主的binlog又被删掉了，这时将会报错。

四、总之：尽可能避免产生errant transaction。能够经过：set sql_log_bin=off的方式在slave执行sql，可是也要考虑到数据一致性。