腾讯云：MySQL数据库的高可用性分析

时间 2019-11-18

原文原文链接

MySQL数据库是目前开源应用最大的关系型数据库，有海量的应用将数据存储在MySQL数据库中。存储数据的安全性和可靠性是生产数据库的关注重点。本文分析了目前采用较多的保障MySQL可用性方案。node

MySQL Replication

MySQL Replication是MySQL官方提供的主从同步方案，用于将一个MySQL实例的数据，同步到另外一个实例中。Replication为保证数据安全作了重要的保证，也是如今运用最广的MySQL容灾方案。Replication用两个或以上的实例搭建了MySQL主从复制集群，提供单点写入，多点读取的服务，实现了读的scale out。

图1. MySQL Replication主从复制集群mysql

如图一所示，一个主实例（M），三个从实例（S），经过replication，Master生成event的binlog，而后发给slave，Slave将event写入relaylog，而后将其提交到自身数据库中，实现主从数据同步。对于数据库之上的业务层来讲，基于MySQL的主从复制集群，单点写入Master，在event同步到Slave后，读逻辑能够从任何一个Slave读取数据，以读写分离的方式，大大下降Master的运行负载，同时提高了Slave的资源利用。sql

对于高可用来讲，MySQL Replication有个重要的缺陷：数据复制的时延。在一般状况下，MySQL Replication数据复制是异步的，便是MySQL写binlog后，发送给Slave并不等待Slave返回确认收到，本地事务就提交了。一旦出现网络延迟或中断，数据延迟发送到Slave侧，主从数据就会出现不一致。在这个阶段中，Master一旦宕机，未发送到Slave的数据就丢失了，没法作到数据的高可用。数据库

为了解决这个问题，google提供了解决方案：半同步和同步复制。在数据异步复制的基础之上，作了一点修改。半同步复制是Master等待event写入Slave的relay后，再提交本地，保证Slave必定收到了须要同步的数据。同步复制不不只是要求Slave收到数据，还要求Slave将数据commit到数据库中，从而保证每次的数据写入，主从数据都是一致的。安全

基于半同步和同步复制，MySQL Replication的高可用获得了质的提高，特别是同步复制。基于同步复制的MySQL Replication集群，每一个实例读取的数据都是一致的，不会存在Slave幻读。同时，Master宕机后，应用程序切换到任何一个Slave均可以保证读写数据的一致性。可是，同步复制带来了重大的性能降低，这里须要作一个折衷。另外，MySQL Replication的主从切换须要人工介入判断，同时须要Slave的replaylog提交完毕，故障恢复时间会比较长。网络

MySQL Fabric

MySQL Fabric是MySQL社区提供的管理多个MySQL服务的扩展。高可用是它设计的主要特性之一。架构

Fabric将两个及以上的MySQL实例划分为一个HA Group。其中的一个是主，其他的都是从。HA Group保证访问指定HA Group的数据老是可用的。其基础的数据复制是基于MySQL Replication，而后，Fabric提供了更多的特性：负载均衡

失效检测和恢复：Fabric监控HA Group中的主实例，一旦发现主实例失效，Fabric会从HA Group中剩余的从实例中选择一个，并将其提高为主实例。运维

读写均衡：Fabric能够自动的处理一个HA Group的读写操做，将写操做发送给主实例，而读请求在多个从实例之间作负载均衡。

图2. Fabric异步

MHA

MHA（MySQL-master-ha）是目前普遍使用的MySQL主从复制的高可用方案。MHA设计目标是自动实现主实例宕机后，从机切换为主，并尽可能下降切换时延（一般在10-30s内切换完成）。同时，由MHA保证在切换过程当中的数据一致性。MHA对MySQL的主从复制集群很是友好，没有对集群作任何侵入性的修改。

MHA的一个重点特性是：在主实例宕机后，MHA能够自动的判断主从复制集群中哪一个从实例的relaylog是最新的，并将最新从实例的差别log“应用”到其他的从实例中，从而保证每一个实例的数据一致。一般状况下，MHA须要10s左右检测主实例异常，并将主实例关闭从而避免脑裂。而后再用10s左右将差别的log event同步，并启用新的Master。整个MHA的RTO时间大约在30s。

MySQL Cluster

MySQL Cluster是一个高度可扩展的，兼容ACID事务的实时数据库，基于分布式架构不存在单点故障，MySQL Cluster支持自动水平扩容，并能作自动的读写负载均衡。

MySQL Cluster使用了一个叫NDB的内存存储引擎来整合多个MySQL实例，提供一个统一的服务集群。如图三所示。

图3. MySQL Cluster组成

MySQL Cluster由SQL Nodes，DataNodes，和NDB Management Server组成。SQL Nodes是应用程序的接口，像普通的mysqld服务同样，接受用户的SQL输入，执行并返回结果。Data Nodes是数据存储节点，NDB Management Server用来管理集群中的每一个node。

MySQL Cluster采用了新的数据分片和容错的方式来实现数据安全和高可用。其由Partition，Replica，Data Node，Node Group构成。

Partition：NDB一张表的一个数据分片，包含一张表的一部分数据。

Replica：一个Partition的拷贝。一个Partition能够有一个或多个Replica，一个Partition的全部Replica数据都是一致的。

Data Node：Replica的存储载体，每一个Node存储一个或多个Replica。

Node Group：一个Data Node的集合。

图4. MySQL Cluster数据高可用

一个MySQL Cluster有4个Node，被分为了两个Grou。Node1和2归属于Group0，Node3和4归属于Group1,。有一张表被分为4个Partition，并分别有两个Replica。Partition0和Partition2的两个Replica，分别存储在Node1和Node2上，Pratition1和Partition3的两个Replica分别存在Node3和Node4上。这样，对于一张表的一个Partition来讲，在整个集群有两份数据，并分布在两个独立的Node上，实现了数据容灾。同时，每次对一个Partition的写操做，都会在两个Replica上呈现，若是Primary Replica异常，那么Backup Replica能够当即提供服务，实现数据的高可用。

小结

本文分析了目前MySQL使用较多的几种MySQL数据复制和高可用方案，从使用来看，MySQL Replication是使用最为普遍的数据复制方案，由于是MySQL原生支持，针对其在不一样场景下的一些缺陷，衍生出了半同步复制，强同步复制等数据高可用的方案。在此基础之上，为了运维方便，MySQL Fabric和MHA应运而生，从不一样的方向解决了主从切换时数据一致性问题和流程自动化的问题。此外，随着分布式系统架构和方案的逐步成熟。MySQL Cluster设计了全新的分布式架构，采用多副