Mysql主从基本原理，以及读写分离致使主库从库数据不一致问题

时间 2019-11-09

标签 mysql 主从基本原理以及读写分离致使数据不一致问题栏目 MySQL 繁體版

原文原文链接

　　一、Mysql的主从同步就是当master（主库）发生数据变化的时候，会实时同步到slave（从库）。node

　　二、主从复制能够水平扩展数据库的负载能力，容错，高可用，数据备份。mysql

　　三、不论是delete、update、insert，仍是建立函数、存储过程，都是在master上，当master有操做的时候，slace会快速的接受到这些操做，从而作同步。linux

　　主要的实现原理：redis

　　　　　　　　一、在master机器上，主从同步时间会被写道特殊的log文件中（binary-log）；sql

　　　　　　　　二、在slave机器上，slave读取主从同步事件，并根据读取的事件变化，在slave库上作相应的更改。数据库

　　详细的主从同步主要有三种形式：statement、row、mixed缓存

　　　　　　　　一、statement：会将对数据库操做的sql语句写道binlog中安全

　　　　　　　　二、row：会将每一条数据的变化写道binlog中。服务器

　　　　　　　　三、mixed：statement与row的混合。Mysql决定何时写statement格式的，何时写row格式的binlog。网络

　　　　在master机器上的操做：

　　　　　　当master上的数据发生变化的时候，该事件变化会按照顺序写入binlog中。当slave连接到master的时候，master机器会为slave开启binlog dunp线程。当master的binlog发生变化的时候，binlog dump线程会通知slave，并将相应的binlog内容发送给slave。

　　　　在slave机器上操做：

　　　　　　当主从同步开启的时候，slave上会建立两个线程：I\O线程。该线程链接到master机器，master机器上的binlog dump 线程会将binlog的内容发送给该I\O线程。该I/O线程接收到binlog内容后，再将内容写入到本地的relay log；sql线程。该线程读取到I/O线程写入的ralay log。而且根据relay log。而且根据relay log 的内容对slave数据库作相应的操做。

　　四、mysql数据库从库同步的延迟问题

　　　　首先在服务器上执行show slave satus;能够看到不少同步的参数：　

Master_Log_File：                      SLAVE中的I/O线程当前正在读取的主服务器二进制日志文件的名称
Read_Master_Log_Pos：        在当前的主服务器二进制日志中，SLAVE中的I/O线程已经读取的位置
Relay_Log_File：                        SQL线程当前正在读取和执行的中继日志文件的名称
Relay_Log_Pos：                        在当前的中继日志中，SQL线程已读取和执行的位置
Relay_Master_Log_File：      由SQL线程执行的包含多数近期事件的主服务器二进制日志文件的名称
Slave_IO_Running：                 I/O线程是否被启动并成功地链接到主服务器上
Slave_SQL_Running：              SQL线程是否被启动
Seconds_Behind_Master：     从属服务器SQL线程和从属服务器I/O线程之间的时间差距，单位以秒计。

从库同步延迟状况出现的
一、show slave status显示参数Seconds_Behind_Master不为0，这个数值可能会很大
二、show slave status显示参数Relay_Master_Log_File和Master_Log_File显示bin-log的编号相差很大，说明bin-log在从库上没有及时同步，因此近期执行的bin-log和当前IO线程所读的bin-log相差很大
三、mysql的从库数据目录下存在大量mysql-relay-log日志，该日志同步完成以后就会被系统自动删除，存在大量日志，说明主从同步延迟很厉害

a、MySQL数据库主从同步延迟原理
mysql主从同步原理：
主库针对写操做，顺序写binlog，从库单线程去主库顺序读”写操做的binlog”，从库取到binlog在本地原样执行（随机写），来保证主从数据逻辑上一致。
mysql的主从复制都是单线程的操做，主库对全部DDL和DML产生binlog，binlog是顺序写，因此效率很高，slave的Slave_IO_Running线程到主库取日志，效率比较高，下一步，问题来了，slave的Slave_SQL_Running线程将主库的DDL和DML操做在slave实施。DML和DDL的IO操做是随即的，不是顺序的，成本高不少，还可能可slave上的其余查询产生lock争用，因为Slave_SQL_Running也是单线程的，因此一个DDL卡主了，须要执行10分钟，那么全部以后的DDL会等待这个DDL执行完才会继续执行，这就致使了延时。
有朋友会问：“主库上那个相同的DDL也须要执行10分，为何slave会延时？”，答案是master能够并发，Slave_SQL_Running线程却不能够。

b、 MySQL数据库主从同步延迟是怎么产生的？
当主库的TPS并发较高时，产生的DDL数量超过slave一个sql线程所能承受的范围，那么延时就产生了，固然还有就是可能与slave的大型query语句产生了锁等待。
首要缘由：数据库在业务上读写压力太大，CPU计算负荷大，网卡负荷大，硬盘随机IO过高
次要缘由：读写binlog带来的性能影响，网络传输延迟。

c、 MySQL数据库主从同步延迟解决方案。

架构方面
1.业务的持久化层的实现采用分库架构，mysql服务可平行扩展，分散压力。
2.单个库读写分离，一主多从，主写从读，分散压力。这样从库压力比主库高，保护主库。
3.服务的基础架构在业务和mysql之间加入memcache或者redis的cache层。下降mysql的读压力。
4.不一样业务的mysql物理上放在不一样机器，分散压力。
5.使用比主库更好的硬件设备做为slave

总结，mysql压力小，延迟天然会变小。

硬件方面

1.采用好服务器，好比4u比2u性能明显好，2u比1u性能明显好。
2.存储用ssd或者盘阵或者san，提高随机写的性能。
3.主从间保证处在同一个交换机下面，而且是万兆环境。
总结，硬件强劲，延迟天然会变小。一句话，缩小延迟的解决方案就是花钱和花时间。

mysql主从同步加速

一、sync_binlog在slave端设置为0
二、–logs-slave-updates 从服务器从主服务器接收到的更新不记入它的二进制日志。
三、直接禁用slave端的binlog
四、slave端，若是使用的存储引擎是innodb，innodb_flush_log_at_trx_commit =2

从文件系统自己属性角度优化
master端
修改linux、Unix文件系统中文件的etime属性， 因为每当读文件时OS都会将读取操做发生的时间回写到磁盘上，对于读操做频繁的数据库文件来讲这是不必的，只会增长磁盘系统的负担影响I/O性能。能够经过设置文件系统的mount属性，组织操做系统写atime信息，在linux上的操做为：
打开/etc/fstab，加上noatime参数
/dev/sdb1 /data reiserfs noatime 1 2
而后从新mount文件系统
#mount -oremount /data

PS：
主库是写，对数据安全性较高，好比sync_binlog=1，innodb_flush_log_at_trx_commit = 1 之类的设置是须要的
而slave则不须要这么高的数据安全，彻底能够讲sync_binlog设置为0或者关闭binlog，innodb_flushlog也能够设置为0来提升sql的执行效率
一、sync_binlog=1 o
MySQL提供一个sync_binlog参数来控制数据库的binlog刷到磁盘上去。
默认，sync_binlog=0，表示MySQL不控制binlog的刷新，由文件系统本身控制它的缓存的刷新。这时候的性能是最好的，可是风险也是最大的。一旦系统Crash，在binlog_cache中的全部binlog信息都会被丢失。
若是sync_binlog>0，表示每sync_binlog次事务提交，MySQL调用文件系统的刷新操做将缓存刷下去。最安全的就是sync_binlog=1了，表示每次事务提交，MySQL都会把binlog刷下去，是最安全可是性能损耗最大的设置。这样的话，在数据库所在的主机操做系统损坏或者忽然掉电的状况下，系统才有可能丢失1个事务的数据。
可是binlog虽然是顺序IO，可是设置sync_binlog=1，多个事务同时提交，一样很大的影响MySQL和IO性能。
虽然能够经过group commit的补丁缓解，可是刷新的频率太高对IO的影响也很是大。对于高并发事务的系统来讲，
“sync_binlog”设置为0和设置为1的系统写入性能差距可能高达5倍甚至更多。
因此不少MySQL DBA设置的sync_binlog并非最安全的1，而是2或者是0。这样牺牲必定的一致性，能够得到更高的并发和性能。
默认状况下，并非每次写入时都将binlog与硬盘同步。所以若是操做系统或机器(不只仅是MySQL服务器)崩溃，有可能binlog中最后的语句丢失了。要想防止这种状况，你可使用sync_binlog全局变量(1是最安全的值，但也是最慢的)，使binlog在每N次binlog写入后与硬盘同步。即便sync_binlog设置为1,出现崩溃时，也有可能表内容和binlog内容之间存在不一致性。

二、innodb_flush_log_at_trx_commit （这个很管用）
抱怨Innodb比MyISAM慢 100倍？那么你大概是忘了调整这个值。默认值1的意思是每一次事务提交或事务外的指令都须要把日志写入（flush）硬盘，这是很费时的。特别是使用电池供电缓存（Battery backed up cache）时。设成2对于不少运用，特别是从MyISAM表转过来的是能够的，它的意思是不写入硬盘而是写入系统缓存。
日志仍然会每秒flush到硬 盘，因此你通常不会丢失超过1-2秒的更新。设成0会更快一点，但安全方面比较差，即便MySQL挂了也可能会丢失事务的数据。而值2只会在整个操做系统 挂了时才可能丢数据。

三、ls(1) 命令可用来列出文件的 atime、ctime 和 mtime。
atime 文件的access time 在读取文件或者执行文件时更改的
ctime 文件的create time 在写入文件，更改全部者，权限或连接设置时随inode的内容更改而更改
mtime 文件的modified time 在写入文件时随文件内容的更改而更改
ls -lc filename 列出文件的 ctime
ls -lu filename 列出文件的 atime
ls -l filename 列出文件的 mtime
stat filename 列出atime，mtime，ctime
atime不必定在访问文件以后被修改
由于：使用ext3文件系统的时候，若是在mount的时候使用了noatime参数那么就不会更新atime信息。
这三个time stamp都放在 inode 中.若是mtime,atime 修改,inode 就必定会改, 既然 inode 改了,那ctime也就跟着改了.
之因此在 mount option 中使用 noatime, 就是不想file system 作太多的修改, 而改善读取效能