使用Xtrabackup对MySQL作主从复制

时间 2019-11-11

原文原文链接

使用Xtrabackup对MySQL作主从复制

说明

xtrabackup

mysqldump对于导出10G如下的数据库或几个表，仍是适用的，并且更快捷。一旦数据量达到100-500G，不管是对原库的压力仍是导出的性能，mysqldump就力不从心了。Percona-Xtrabackup备份工具，是实现MySQL在线热备工做的不二选择，可进行全量、增量、单表备份和还原。（但当数据量更大时，可能须要考虑分库分表，或使用 LVM 快照来加快备份速度了）。
2.2版本xtrabackup能对InnoDB和XtraDB存储引擎的数据库非阻塞地备份，innobackupex经过perl封装了一层xtrabackup，对MyISAM的备份经过加表读锁的方式实现。2.3版本xtrabackup命令直接支持MyISAM引擎。mysql

Xtrabackup优点：

无需中止数据库进行InnoDB热备
增量备份MySQL
流压缩到传输到其它服务器
能比较容易地建立主从同步
备份MySQL时不会增大服务器负载

replication

为何要作主从复制？

我想这是要在实施之前要想清楚的问题。是为了实现读写分离，减轻主库负载或数据分析？为了数据安全，作备份恢复？主从切换作高可用？
大部分场景下，以上三个问号一主一从都可以解决，并且任何生产环境都建议你至少要有一个从库，假如你的读操做压力特别大，甚至要作一主多从，还能够不一样的slave扮演不一样的角色，例如使用不一样的索引，或者不一样的存储引擎，或使用一个小内存server作slave只用于备份。（固然slave太多也会对master的负载和网络带宽形成压力，此时能够考虑级联复制，即 A->B->C ）。
还有须要考虑的是，一主一从，一旦作了主从切换，不经过其它HA（High Available，是双机集群系统简称，指高可用性集群，是保证业务连续性的有效解决方案，通常有两个或两个以上的节点，且分为活动节点及备用节点。）手段干预的话，业务访问的仍是原IP，并且原主库很容易就做废了。因而“主-主”复制就产生了，凭借各自不一样的server-id，能够避免“A的变化同步到B，B应用变化又同步到A”这样循环复制的问题。但建议是，主主复制，其中一个主库强制设置为只读，主从切换后架构依然是可用的。
复制过程是slave主动向master拉取，而不是master去推的，因此理想状况下作搭建主从时不须要master作出任何改变甚至停服，slave失败也不影响主库。sql

复制类型

基于语句的复制：STATEMENT
在主服务器上执行的SQL语句，在从服务器上执行一样的语句，有可能会因为SQL执行上下文环境不一样而是数据不一致，例如调用NOW()函数。MySQL在5.7.7之前默认采用基于语句的复制，在 5.7.7 及之后版本默认改用 row-based（基于行的）。
基于行的复制：ROW
把改变的内容复制过去，而不是把命令在从服务器上执行一遍。从mysql5.0开始支持，可以严格保证数据彻底一致，但此时用mysqlbinlog去分析日志就没啥意义。由于任何一条update语句，都会把涉及到的行数据所有set值，因此binlog文件会比较大。（遇到的一个坑是，迁移时，从库改正了字段默认值定义，但数据在主库更改后，即便产生的新数据默认值是正确的，但基于行的复制依然用不正确的值字段所有更新了）
混合类型的复制: MIXED
默认采用基于语句的复制，一旦发现基于语句的没法精确的复制时，就会采用基于行的复制。

mysql系统库mysql库里面表的日志记录格式须要说明：在经过如INSERT、UPDATE、DELETE、TRUNCATE等方式直接修改数据的语句，使用binlog_format指定的方式记录，但使用GRANT、ALTER、CREATE、RENAME等改动的mysql库里数据的，会强制使用statement-based方式记录binlog。
能够在线修改二进制日志类型，如SET SESSION binlog_format=MIXED;，须要SUPER权限。数据库

复制类型还能够分为：异步复制和半同步复制。
一般没说明指的都是异步，即主库执行完Commit后，在主库写入Binlog日志后便可成功返回客户端，无需等等Binlog日志传送给从库，一旦主库宕机，有可能会丢失日志。而半同步复制，是等待其中一个从库也接收到Binlog事务并成功写入Relay Log以后，才返回Commit操做成功给客户端；如此半同步就保证了事务成功提交后至少有两份日志记录，一份在主库Binlog上，另外一份在从库的Relay Log上，从而进一步保证数据完整性；半同步复制很大程度取决于主从网络RTT（往返时延），以插件 semisync_master/semisync_slave 形式存在。vim

原理

master将改变记录到二进制日志(binary log)中（这些记录叫作二进制日志事件，binary log events）；
slave将master的binary log events拷贝到它的中继日志(relay log)；
slave重作中继日志中的事件，将改变反映它本身的数据。

该过程的第一部分就是master记录二进制日志。在每一个事务更新数据完成以前，master在二进制日志记录这些改变。MySQL将事务串行的写入二进制日志，即便事务中的语句都是交叉执行的。在事件写入二进制日志完成后，master通知存储引擎提交事务。
下一步将master的binary log拷贝到它本身的中继日志。首先，slave开始一个工做线程——I/O线程。I/O线程在master上打开一个普通的链接，请求从指定日志文件的指定位置以后的日志内容，而后开始binlog dump process。Binlog dump process从master的二进制日志中读取事件，若是已经跟上master，它会睡眠并等待master产生新的事件。I/O线程将这些事件写入中继日志。
SQL slave thread（SQL从线程）处理该过程的最后一步。SQL线程从中继日志读取事件，并重放其中的事件而更新slave的数据，使其与master中的数据一致。只要该线程与I/O线程保持一致，中继日志一般会位于OS的缓存中，因此中继日志的开销很小。

此外，在master中也有一个工做线程：和其它MySQL的链接同样，slave在master中打开一个链接也会使得master开始一个线程。复制过程有一个很重要的限制——复制在slave上是串行化的，也就是说master上的并行更新操做不能在slave上并行操做。缓存

补充

mysql 5.7开始加入了多源复制，这个特性对同时有不少个mysql实例是颇有用的，阿里云RDS（迁移）实现了相似的方式。
从MySQL 5.6.2开始，mysql binlog支持checksum校验，而且5.6.6默认启用（CRC32 ），这对本身模拟实现mysql复制的场景有影响。

CRC32（Cyclic Redundancy Check）校验实用程序库在数据存储和数据通信领域，为了保证数据的正确，就不得不采用检错的手段。在诸多检错手段中，CRC是最著名的一种。CRC的全称是循环冗余校验。安全

主从配置 bash

步骤：主从版本一致—>主库受权复制账号—>确保开启binlog及主从server_id惟一—>xtrabackup恢复到从库—>记录xtrabackup_binlog_info中binlog名称及偏移量—>从库change master to —>slave start—>检查两个yes。服务器

主库配置

[root@root-01 ~]# vim /etc/my.cnf
……
server-id=179
#自定义
log_bin=root-01
#指定log前缀
[root@ root-01 ~]# /etc/init.d/mysqld restart
Shutting down MySQL...... SUCCESS! 
Starting MySQL.................. SUCCESS!

建立复制帐号

在主库操做：网络

mysql>  GRANT REPLICATION SLAVE ON *.* TO 'rpl'@'192.168.2.%' IDENTIFIED BY '123456';
Query OK, 0 rows affected (0.00 sec)

使用innobackupex备份（恢复）数据

分别在主、从服务器安装innobackupex工具：架构

安装innobackupex工具：
[root@root-01 ~]#  rpm -ivh  http://www.percona.com/downloads/percona-release/redhat/0.1-3/percona-release-0.1-3.noarch.rpm
[root@root-01 ~]#   yum install -y percona-xtrabackup

全量备份

在主服务器操做！
这里假设比较简单的状况：全量备份，全量恢复，不涉及增量。

建立备份用户：
[root@root-01 ~]# mysql -uroot
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 212
Server version: 5.6.35-log MySQL Community Server (GPL)

Copyright (c) 2000, 2016, Oracle and/or its affiliates. All rights reserved.

Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

mysql> grant RELOAD, LOCK TABLES, REPLICATION CLIENT on *.* to 'bakuser'@'localhost' identified by '123456';
Query OK, 0 rows affected (0.02 sec)


mysql> grant RELOAD, LOCK TABLES, REPLICATION CLIENT on *.* to 'bakuser'@'localhost' identified by '123456';
Query OK, 0 rows affected (0.00 sec)
#该用户只须要有备份权限便可，因此在建立用户时只授予其部分权限

mysql> flush privileges;
Query OK, 0 rows affected (0.04 sec)
#刷新

mysql> quit
Bye


建立备份文件存放目录：
[root@root-01 ~]# mkdir /data/backup

备份：
[root@root-01 ~]# innobackupex --defaults-file=/etc/my.cnf --user=bakuser --password='123456' -S /tmp/mysql.sock /data/backup


打包备份文件：
[root@root-01 ~]# cd /data/backup/
[root@root-01 backup]# ls
2017-10-01_11-51-05

[root@root-01 backup]# tar -cvf 2017-10-01_11-51-05.tar 2017-10-01_11-51-05

默认会以当天日期+时间戳命名备份目录（2017-10-01_11-51-05），通常会对它进行tar压缩，因为tar只能单进程，因此每每这个压缩过程会比备份过程耗时2倍还多。拷贝到须要恢复（作从库）的目录。若是手头有一份未压缩的全备数据，要在另外一台恢复，其实还不如直接 rsync 过来，将近400G的数据压缩与解压缩过程特别漫长

使用innobackupex恢复数据

在从服务器操做：

关闭Mysql：
[root@root-02 ~]# /etc/init.d/mysql stop
Shutting down MySQL.. SUCCESS! 

把/data/mysql目录拷贝并重命名
[root@root-02 data]# cp -vrp mysql mysql.bak

把/data/mysql目录清空
[root@root-02 data]# rm -vfr mysql/*

建立备份文件存放目录：
[root@root-02 ~]# mkdir /data/backup

拷贝主库中的备份数据到从服务器：
[root@root-02 ~]# scp 192.168.2.115:/data/backup/2017-10-01_11-51-05.tar /data/backup
The authenticity of host '192.168.2.115 (192.168.2.115)' can't be established.
ECDSA key fingerprint is bd:fd:56:cf:07:80:0d:a6:9c:38:00:be:33:1f:f5:7a.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added '192.168.2.115' (ECDSA) to the list of known hosts.
root@192.168.2.115's password: 
2017-10-01_11-51-05.tar         

解压备份：
[root@root-02 ~]# cd /data/backup/

[root@root-02 backup]# tar -xvf 2017-10-01_11-51-05.tar 

开始恢复：
[root@root-02 ~]# innobackupex  --apply-log /data/backup/2017-10-01_11-51-05
[root@root-02 ~]# innobackupex --defaults-file=/etc/my.cnf --copy-back /data/backup/2017-10-01_11-51-05
[root@root-02 ~]# chown -R mysql:mysql /data/mysql
说明：主库中的数据备份到了从库中.

配置从库

[root@root-02 ~]# cat /etc/my.cnf

[mysqld]
datadir=/data/mysql
socket=/tmp/mysql.sock
server-id=116

注意：

从库的server-id必定不能和主库的同样，不然会出现以下错误：Slave: received end packet FROM server, apparent master shutdown.
从库通常做为只读库使用，因此为安全起见，设置只读 set global read_only=1;能够在从服务器的my.cnf里加入read-only参数来实现这一点，惟一须要注意的一点事read-only仅对没有super权限的用户有效。因此最好核对一下链接从服务器的用户，确保其没有super权限。（本机具备super权限，因此不作该配置）。
关于从库的事件
MYSQL Replication 能够很好的达到你的预期：从库的事件不会本身去执行，主库会把event执行的结果直接同步。在statement模式下，复制的是 event BODY 里的SQL，在row模式下是主库事件执行完成后影响的行精确复制。
从库event_scheduler参数是被忽略的，而且每一个event 状态会是SLAVESIDE_DISABLED，但CREATE/ALTER EVENT等操做语句是会复制。主从切换后，从库事件状态会变成ENABLE。
参数调整
从库是不容许写入的，不然数据就不一致了。从库实例的配置能够不要主库那么高，好比原16G的buffer pool，根据用途，从库能够设到4-8G（当时前提是未来你也不打算把它切换为主库用）。相应的，read_buffer_size，sort_buffer_size, query_cache_size 这些读相关参数能够略微增大。固然我通常都懒得去改。
skip-slave-start
主从建立完成后，默认状况下次启动从库，会自动启动复制进程，通常这也正是咱们须要的，但在维护阶段时你可能不想从库启动后当即开始复制，--skip-slave-start选项能够帮到你。
log-slave-updates
正常状况从库是不须要写回放日志产生的binlog，无形中增长服务器压力。但若是你想要实现级联复制即A->B->C，B同时是A的从库，也是C的主库，就须要开启 log-bin 和 log-slave-updates
sync_binlog
For the greatest possible durability and consistency in a replication setup using InnoDB with transactions, you should use innodb_flush_log_at_trx_commit=1 and sync_binlog=1 in the master my.cnf file.
上面的话同时也意味着性能最低。能够在这埋点，假如出现慢的状况，把两参数调成2。
过滤表mysql-replica-filter

启动从库

[root@root-02 ~]# /etc/init.d/mysql start
Starting MySQL. SUCCESS!

change master (在从库操做)

mysql> change master to master_host='192.168.2.115',master_port=3306,master_user='rpl',master_password='123456',master_log_file='root-01.000001',master_log_pos=52279;
Query OK, 0 rows affected, 2 warnings (0.01 sec)

说明：上面的master_log_file和master_log_pos便是输出的值，也能够在新的数据目录下xtrabackup_binlog_info找到信息。

开始同步（在从库操做）

mysql>  start slave;
Query OK, 0 rows affected (0.01 sec)

mysql> show slave status\G
.................................
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes
 .................................


说明:执行show slave status\G命令，出现“Slave_IO_Running: Yes；Slave_SQL_Running: Yes”信息，说明主从同步配置完成

解释

mysql> show slave status\G
*************************** 1. row ***************************
               Slave_IO_State: Waiting for master to send event
                  Master_Host: 192.168.2.115
                  Master_User: rpl
                  Master_Port: 3306
                Connect_Retry: 60
              Master_Log_File: root-01.000001
          Read_Master_Log_Pos: 374291
               Relay_Log_File: root-02-relay-bin.000002
                Relay_Log_Pos: 322293
        Relay_Master_Log_File: root-01.000001
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes

Master_Log_File： I/O线程当前正在读取的主服务器二进制日志文件的名称
Read_Master_Log_Pos：本机I/O线程读取主服务器二进制日志位置
上面2各值，与在主库执行show master status;看到的值若是基本接近，说明从库IO线程已经遇上了主库的binlog

Relay_Master_Log_File: 由SQL线程执行的包含多数近期事件的主服务器二进制日志文件的名称
Exec_Master_Log_Pos: SQL线程执行来自master的二进制日志最后一个事件位置
与上面的Relay_Master_Log_File一块儿，同Master_Log_File、Read_Master_Log_Pos比较，能看到SQL线程是否已经遇上从库本地的IO线程

Slave_IO_Running：I/O线程是否启动并成功链接到主服务器上
通常和下面的Slave_IO_Running和Seconds_Behind_Master一块儿监控主从健康状态

Slave_SQL_Running：SQL线程是否启动 Seconds_Behind_Master: 从属服务器“落后”多少秒官网的解释是：The number of seconds that the slave SQL thread is behind processing the master binary log。可是当 SBM 为 0 时也不表明必定没有延迟，由于可能由于网络慢的缘故，从库的IO线程传输binlog太慢，它的SQL线程应用日志很容易就遇上relay log，但实际主库产生的binlog比传输的快，就会形成为0的假象. 有时你反复status会发现 Seconds_Behind_Master 的值在0与一个很大的数之间波动，有多是主库上执行了一个很是大的event，没执行完毕的时候从库SBM显示为0，event执行完成并传输完binlog后，就会显示SBM很是巨大。（我在从机房迁移mysql到阿里云上部分库老出现这种状况，应该跟网络和大event都有关系）。另外，relay log 中event记录的时间戳是主库上的时间戳，而SQL thread的时间戳是从库上的，若是主库和从库的时间误差较大，那么这个SBM的意义就基本不存在了。

使用Xtrabackup对MySQL作主从复制

使用Xtrabackup对MySQL作主从复制

说明

xtrabackup

Xtrabackup优点：

replication

为何要作主从复制？

复制类型

原理

补充

主库配置

建立复制帐号

使用innobackupex备份（恢复）数据

全量备份

使用innobackupex恢复数据

配置从库

启动从库

change master (在从库操做)

开始同步 （在从库操做）

解释

开始同步（在从库操做）