1) mha管理节点安装包:php
mha4mysql-manager-0.56-0.el6.noarch.rpmnode
mha4mysql-manager-0.56.tar.gzmysql
2) mha node节点安装包:linux
mha4mysql-node-0.56-0.el6.noarch.rpmsql
mha4mysql-node-0.56.tar.gz数据库
3) mysql中间件:vim
Atlas-2.2.1.el6.x86_64.rpm服务器
4) mysql源码安装包微信
mysql-5.6.17-linux-glibc2.5-x86_64.tar网络
姓名:松信嘉范
MySQL/Linux专家
2001年索尼公司入职
2001年开始使用oracle
2004年开始使用MySQL
2006年9月-2010年8月MySQL从事顾问
2010年-2012年DeNA
2012年至今Facebook
一、MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,是一套优秀的做为MySQL高可用性环境下故障切换和主从提高的高可用软件。在MySQL故障切换过程当中,MHA能作到0~30秒以内自动完成数据库的故障切换操做,而且在进行故障切换过程当中,MHA能最大程度上保证数据库的一致性,以达到真正意义上的高可用。
二、MHA由两部分组成:MHA Manager(管理节点)和MHA Node(数据节点)。MHA Manager能够独立部署在一台独立的机器上管理多个Master-Slave集群,也能够部署在一台Slave上。当Master出现故障时,它能够自动将最新数据的Slave提高为新的Master,而后将全部其余的Slave从新指向新的Master。整个故障转移过程对应程序是彻底透明的。
一、复制主库binlog日志出来
二、找出relaylog日志最全的从库
三、将最全的relaylog日志在全部从库中同步(第一次数据同步)
四、将以前最全的那个从库提高为主库
五、将复制出来的binlog日志放到新提高为主库的从库里面
六、其余全部从库从新指向新提高主库,继续主从复制
MHA软件由两部分组成,Manager工具包和Node工具包,具体的说明以下:
连接:https://pan.baidu.com/s/1aSh6hKFDcA6VAsXicbTSSQ
提取码:2ynt
yum -y install ncurses-devel
yum -y install libaio
tar xf mysql-5.6.17-linux-glibc2.5-x86_64.tar.gz -C /usr/local/
ln -s /usr/local/mysql-5.6.17-linux-glibc2.5-x86_64 /usr/local/mysql
useradd mysql -s /sbin/nologin -M
/usr/local/mysql/scripts/mysql_install_db --user=mysql --basedir=/usr/local/mysql --datadir=/usr/local/mysql/data/
/bin/cp /usr/local/mysql/support-files/my-default.cnf /etc/my.cnf
/bin/cp /usr/local/mysql/support-files/mysql.server /etc/init.d/mysqld
ln -s /usr/local/mysql/bin/* /usr/local/bin/
mysqladmin -uroot password '123123'
主库和从库都要开启binlog
主库和从库server-id不一样
要有主从复制用户
[root@MySQL-Master ~]# vim /etc/my.cnf
[root@MySQL-Master ~]# cat /etc/my.cnf
[client]
socket = /usr/local/mysqld/data/mysql.sock
[mysqld]
lower_case_tabel_names = 1
default-storage-engine = InnoDB
port = 3306
datadir = /usr/local/mysql/data
character-set-server = utf8
socket = /usr/local/mysql/data/mysql.sock
log_bin = mysql-bin #开启binlog日志
server_id = 1 #设置server_id
innodb_buffer_pool_size = 200M
slave-parallel-workers = 8
thread_cache_size = 600
back_log = 600
slave_net_timeout = 60
max_binlog_size = 512M
key_buffer_size = 8M
query_cache_size = 64M
join_buffer_size = 2M
sort_buffer_size = 2M
query_cache_type = 1
thread_stack = 192K
(1)删除没必要要的用户
mysql>
mysql> select user,host from mysql.user;
+------+--------------+
| user | host |
+------+--------------+
| root | 127.0.0.1 |
| root | ::1 |
| | localhost |
| root | localhost |
| | mysql-master |
| root | mysql-master |
+------+--------------+
6 rows in set (0.10 sec)
mysql> drop user root@'127.0.0.1';
Query OK, 0 rows affected (0.00 sec)
mysql> drop user root@'::1';
Query OK, 0 rows affected (0.00 sec)
mysql> drop user ' '@'localhost';
Query OK, 0 rows affected (0.00 sec)
mysql> drop user ' '@'mysql-master';
Query OK, 0 rows affected (0.00 sec)
mysql> select user,host from mysql.user;
+------+--------------+
| user | host |
+------+--------------+
| root | localhost |
| root | mysql-master |
+------+--------------+
2 rows in set (0.00 sec)
(2)建立主从复制用户
MySQL-SlaveA
MySQL-SlaveB
特别提示: 在以往若是是基于binlog日志的主从复制,则必需要记住主库的master状态信息。
可是在MySQL5.6版本里多了一个Gtid的功能,能够自动记录主从复制位置点的信息,并在日志中输出出来。
编辑mysql配置文件(主库从库都须要修改)
三台机器都须要加上上图标注的三行代码
修改完配置文件之后重启动数据库
/etc/init.d/mysqld restart
再次查看GTID状态
再次提示:
主库从库都必需要开启GTID,不然在作主从复制的时候就会报错.
mysql>start slave; 开启主从复制
两个从库MySQL-SlaveA和MySQL-SlaveB都执行以上步骤。
MySQL主从复制,启动slave时,出现下面报错:
mysql> start slave;
ERROR 1872 (HY000): Slave failed to initialize relay log info structure from the repository
解决办法:
一、GTID(Global Transaction)全局事务标识符:是一个惟一的标识符,它建立并与源服务器(主)上提交的每一个事务相关联。此标识符不只对其发起的服务器是惟一的,并且在给定复制设置中的全部服务器上都是惟一的。全部交易和全部GTID之间都有1对1的映射。
二、GTID其实是由UUID+TID组成的。其中UUID是一个MySQL实例的惟一标识。TID表明了该实例上已经提交的事务数量,而且随着事务提交单调递增。
下面是一个GTID的具体形式:
3E11FA47-71CA-11E1-9E33-C80AA9429562:23
(1)支持多线程复制:事实上是针对每一个database开启相应的独立线程,即每一个库有一个单独的(sql thread)
(2)支持启用GTID,在配置主从复制,传统的方式里,你须要找到binlog和POS点,而后change master to 指向。在mysql5.6里,无须再知道binlog和POS点,只须要知道master的IP/端口/帐号密码便可,由于同步复制是自动的,MySQL经过内部机制GTID自动找点同步。
(3)基于Row复制只保存改变的列,大大节省磁盘空间,网络,内存等
(4)支持把Master和Slave的相关信息记录在Table中;原来是记录在文件里,如今则记录在表里,加强可用性
(5)支持延迟复制
#mysql配置文件:
[mysqld]
gtid_mode=ON
enforce_gtid_consistency
#查看
show global variables like ‘%gtid%’;
编辑配置文件/etc/my.cnf
修改完毕后重启mysql服务:/etc/init.d/mysqld restart
mha4mysql-node-0.56-0.el6.noarch.rpm如下连接提取
连接:https://pan.baidu.com/s/1S9FDyBjxEBXBF00aAFK4pw
提取码:opja
光盘安装依赖包 yum -y install perl-DBD-MySQL
安装mha4mysql-node-0.56-0.el6.noarch.rpm
rpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm
#使用阿里云源+epel源
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-6.repo
wget -O /etc/yum.repos.d/epel-6.repo http://mirrors.aliyun.com/repo/epel-6.repo
#安装manager依赖包(须要公网源)
yum -y install perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
#安装manager包
[root@MySQL-SlaveB rpm]# rpm -ivh mha4mysql-manager-0.56-0.el6.noarch.rpm
Preparing... ########################################### [100%]
1:mha4mysql-manager ########################################### [100%]
#建立配置文件目录
mkdir -p /etc/mha
#建立日志目录
mkdir -p /var/log/mha/mha1
#建立配置文件(默认没有)
[root@MySQL-SlaveB ~]# cd /etc/mha/
[root@MySQL-SlaveB mha]# ls
[root@MySQL-SlaveB mha]# vim /etc/mha/mha1.cnf
[root@MySQL-SlaveB mha]# cat /etc/mha/mha1.cnf
[server default]
manager_log=/var/log/mha/mha1/manager #manager管理日志存放路径
manager_workdir=/var/log/mha/mha1 #manager管理日志的目录路径
master_binlog_dir=/usr/local/mysql/data #binlog日志的存放路径
user=mha #管理帐户
password=123123 #管理帐户密码
ping_interval=2 #存活检查的间隔时间
repl_user=rep #主从复制的受权帐户
repl_password=123123 #主从复制的受权帐户密码
ssh_user=root #用于ssh链接的帐户
[server1]
hostname=192.168.200.159
port=3306
[server2]
#candidate_master=1 #此条暂时注释掉(后面解释)
#check_repl_delay=0 #此条暂时注释掉(后面解释)
hostname=192.168.200.161
port=3306
[server3]
hostname=192.168.200.160
port=3306
#**特别提示:**
#以上配置文件内容里每行的最后不要留有空格,所以,不能复制的呦
特别说明:
参数:candidate_master=1
解释:设置为候选master,若是设置该参数之后,发生主从切换之后会将此从库提高为主库,即便这个主库不是集群中事件最新的slave
参数:check_repl_delay=0
解释:默认状况下若是一个slave落后master 100M的relay logs 的话,MHA将不会选择该slave做为一个新的master,由于对于这个slave的恢复须要花费很长时间,经过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机很是有用,由于这个候选主在切换的过程当中必定是新的master
#建立密钥对
[root@MySQL-SlaveB ~]# ssh-keygen -t dsa -P "" -f ~/.ssh/id_dsa >/dev/null 2>&1
#发送MySQL-SlaveB公钥,包括本身
[root@MySQL-SlaveB ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.159
[root@MySQL-SlaveB ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.161
[root@MySQL-SlaveB ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.160
#发送MySQL-SlaveA公钥,包括本身
[root@MySQL-SlaveA ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.159
[root@MySQL-SlaveA ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.161
[root@MySQL-SlaveA ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.160
#发送MySQL-Master公钥,包括本身
[root@MySQL-Master ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.159
[root@MySQL-Master ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.160
[root@MySQL-Master ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.161
[root@MySQL-SlaveB ~]# masterha_check_ssh --conf=/etc/mha/mha1.cnf #ssh检查命令
[root@MySQL-SlaveB ~]# masterha_check_repl --conf=/etc/mha/mha1.cnf
(1)错误的主从复制检测
所以在MySQL-SlaveA和MySQL-SlaveB上添加主从复制的用户便可。
grant replication slave on . to rep@'192.168.200.%' identified by '123123';
[root@mysql-slaveB ~]# nohup masterha_manager --conf=/etc/mha/mha1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/mha1/manager.log 2>&1 &
[1] 3408
[root@mysql-slaveB ~]# ps -ef | grep perl | grep -v grep
root 3408 1272 1 03:03 pts/0 00:00:00 perl /usr/bin/masterha_manager --conf=/etc/mha/mha1.cnf --remove_dead_master_conf --ignore_last_failover
初始状态:
(1)登录mysql-db02(192.168.0.53)查看信息状态
(2)停掉mysql-db01(192.168.0.51)上的MySQL服务
[root@MySQL-Master ~]# /etc/init.d/mysqld stop
Shutting down MySQL..... SUCCESS!
(3)查看slaveB上的MySQL从库同步状态
(4)查看mysql-db02上的MySQL,主库同步状态。
(5)查看mysql-db03上的mha进程状态
(6)查看mha配置文件信息
说明:
看成为主库的mysql-db01上的MySQL宕机之后,mha经过检测发现mysql-db01宕机,那么会将binlog日志最全的从库马上提高为主库,而其余的从库会指向新的主库进行再次同步。
查询mha日志路径 /var/log/mha/mha1/manager
因为mysql-Master的MySQL服务宕机,所以mha将mysql-SlaveA提高为了主库。所以,咱们须要将宕机的mysql-Master的MySQL服务启动,而后做为主库mysql-SlaveA的从库。
初始状态:
(1)将故障宕机的mysql-Master的MySQL服务启动并受权进行从同步
/etc/init.d/mysqld start #启动Master的MySQL服务
#进入mysql受权进行从同步
mysql> CHANGE MASTER TO MASTER_HOST='192.168.200.161', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='rep', MASTER_PASSWORD='123123';
(2)将mha配置文件里缺失的部分补全
(3)启动mha进程
注:若是发现从库没有mha帐户须要将主库的mha帐户删除后重新受权一个,这样从库就自动复制过来了。通常状况下不会这样,我可能出现bug了!!!
(4)停掉mysql-slaveA上的MySQL服务
(5)查看mysql-slaveB上的主从同步状态:
(6)启动mysql-slaveA上的MySQL服务
[root@MySQL-SlaveA ~]# /etc/init.d/mysqld start
Starting MySQL.. SUCCESS!
[root@MySQL-SlaveA ~]# mysql -uroot -p123123
mysql> CHANGE MASTER TO MASTER_HOST='192.168.200.159', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='rep', MASTER_PASSWORD='123123';
mysql> start slave;
mysql> show slave status\G
(7)再次补全mha配置文件后,启动mha进程
注:此次上述没有自动复制mha帐户的问题没有发生,可能真的遇到了bug!!!
综上实验,当slaveB新加了参数验证,主库再次宕机的话,新的主库变成了本身。