复制的原理其实很简单,仅分为如下三步:mysql
在主库上把数据更改记录到二进制日志binary log中,具体是在每次准备提交事务完成数据更新前,主库将数据更新的事件记录到二进制日志中去,Mysql会按照事务提交的顺序来记录二进制日志的。日志记录好以后,主库通知存储引擎提交事务。sql
从库会启动一个IO线程,该线程会链接到主库。而主库上的binlog dump线程会去读取主库本地的binlog日志文件中的更新事件。发往从库,从库接收到日志以后会将其记录到本地的中继日志relay-log当中。数据库
从库中的SQL线程读取中继日志relay-log中的事件,将其重放到从库中。(在5.6版本以前SQL线程是单线程的,使得主从之间延迟更大)缓存
日志文件中记录的究竟是什么呢? mysql支持了两种日志格式,这两种日志格式也体现了各自的复制方式安全
基于语句的复制至关于逻辑复制,即二进制日志记录了操做的语句,经过这些语句在从库进行重放来实现复制。这种方式简单,二进制日志占用空间少,使得带宽小传输效率较高。 可是基于语句的更新依赖于其余因素,好比插入数据时利用时间戳函数调用当前时间做为时间值也会出现问题,由于因为主从之间的延迟致使时间值不一致。存储过程和触发器也可能出现问题。因此在开发当中咱们应该将逻辑尽可能放在代码层,而不该放到mysql中,不易扩展。bash
基于行的复制至关于物理复制,即二进制日志记录了实际更新数据的每一行。这样致使行复制的压力比较大,由于日志占用空间较大,传输占用带宽也较高。可是比基于语句复制更加精确,能够屏蔽一些因为主库从库之间的差别致使的不一致。如刚才提到的时间戳函数。网络
语句复制:多线程
行复制:架构
# 若是在双主复制结构中没有设置ID的话就会致使循环同步问题
server_id=1
# 即日志中记录的是语句仍是行更新或者是混合
binlog_format=mixed
# 在进行n次事务提交之后,Mysql将执行一次fsync的磁盘同步指令。将缓冲区数据刷新到磁盘。
# 为0的话由Mysql本身控制频率。
sync_binlog=n
# 为0的话,log buffer将每秒一次地写入log file中而且刷新到磁盘。
# mysqld进程崩溃会丢失一秒内的全部事务。
# 为1的话,每次事务log buffer会写入log file并刷新到磁盘。(较为安全)
# 在崩溃的时候,仅会丢失一个事务。
# 为2的话,每次事务log buffer会写入log file,但一秒一次刷新到磁盘
innodb_flush_logs_at_trx_commit=0
# 阻止从库崩溃后自动启动复制,给一些时间来修复可能的问题,
# 崩溃后再自动复制可能会致使更多的问题。而且自己就是不一致的
skip_slave_start=1
# 是否将从库同步的事件也记录到从库自身的bin-log中
# 容许备库将重放的事件也记录到自身的二进制日志中去,能够将备库当作另一台主库的从库
log_slave_update
# 日志过时删除时间,延迟严重的话会致使日志文件占用磁盘
expire_logs_days=7
复制代码
innodb_flush_logs_at_trx_commit的三个参数很容易弄混。如下是详细的解析:并发
mysql先将日志写到log buffer缓冲区当中,再将log buffer缓冲区的数据写到log file日志文件中,此时写入的是内存中的log file,最终仍需操做系统将内存中的数据刷写到磁盘上。
推荐使用:innodb_flush_logs_at_trx_commit=2以及sync_binlog=500性能会较快。innodb_flush_logs_at_trx_commit以及sync_binlog都为1的话,较为安全。
网络方面:将从库分布在相同局域网内或网络延迟较小的环境中。
硬件方面:从库配置更好的硬件,提高随机写的性能。
配置方面:从库配置sync_binlog=0,innodb_flush_log_at_trx_commit=2,logs-slave-updates=0,增大innodb_buffer_pool_size,让更多操做在Mysql内存中完成,减小磁盘操做。或者升级Mysql5.7版本使用并行复制。
架构方面:好比在事务当中尽可能对主库读写,其余非事务中的读在从库。消除一部分延迟带来的数据库不一致。增长缓存下降一些从库的负载。