Redis主从同步要深刻理解？一篇文章足矣！

时间 2019-12-11

标签 redis 主从同步深刻理解一篇文章栏目 Redis 繁體版

原文原文链接

前言：

今天想和你们分享有关 Redis 主从同步（也称「复制」）的内容。数据库

咱们知道，当有多台 Redis 服务器时，确定就有一台主服务器和多台从服务器。通常来讲，主服务器进行写操做，从服务器进行读操做。服务器

那么这里有存在一个问题：从服务器如何和主服务器进行数据同步的呢？网络

这个问题，就是经过今天的内容：主从同步来解决的。学习

文章内容依旧比较干，建议你们静下心来专心看，文末会给你们作个简单总结概括。优化

1. 如何进行主从同步

假如，如今有 2 台 Redis 服务器，地址分别是 127.0.0.1:6379 和 127.0.0.1:123453d

咱们在 127.0.0.1:12345 的客户端输入命令：code

127.0.0.1:12345> SLAVEOF 127.0.0.6379orm

如此 127.0.0.1:12345 服务器就会去复制 127.0.0.1:6379 的数据。即前者是从服务器，后者为主服务器。blog

除了以上方式进行复制以外，还能够经过配置文件中的 slaveof 选项进行设置。队列

可能，求知欲爆棚的你会想知道，Redis 是怎么进行主从同步的？

ok，下面咱们继续了解一下。

2. 主从同步的实现过程

主从同步分为 2 个步骤：同步和命令传播

同步：将从服务器的数据库状态更新成主服务器当前的数据库状态。（数据库状态在这篇文章开头有提到是什么意思，不清楚的小伙伴能够先看下：《持久化》）
命令传播：当主服务器数据库状态被修改后，致使主从服务器数据库状态不一致，此时须要让主从数据同步到一致的过程。

上面就是主从同步 2 个步骤的做用，下面我打算稍微细说这两个步骤的实现过程。

这里须要提早说明一下：在 Redis 2.8 版本以前，进行主从复制时必定会顺序执行上述两个步骤，而从 2.8 开始则可能只须要执行命令传播便可。在下文也会解释为何会这样？

2.1 同步

从服务器对主服务的同步操做，须要经过 sync 命令来实现，如下是 sync 命令的执行步骤：

从服务器向主服务器发送 sync 命令
收到 sync 命令后，主服务器执行 bgsave 命令，用来生成 rdb 文件，并在一个缓冲区中记录从如今开始执行的写命令。
bgsave 执行完成后，将生成的 rdb 文件发送给从服务器，用来给从服务器更新数据
主服务器再将缓冲区记录的写命令发送给从服务器，从服务器执行完这些写命令后，此时的数据库状态便和主服务器一致了。

用图表示就是这样的：

2.2 命令传播

通过同步操做，此时主从的数据库状态其实已经一致了，但这种一致的状态的并非一成不变的。
在完成同步以后，也许主服务器立刻就接受到了新的写命令，执行完该命令后，主从的数据库状态又不一致。

为了再次让主从数据库状态一致，主服务器就须要向从服务器执行命令传播操做，即把刚才形成不一致的写命令，发送给从服务器去执行。从服务器执行完成以后，主从数据库状态就又恢复一致了。

这里插播一个疑问：

不知道有没有的读者以为，当发生上述不一致的状况后，Redis 再执行同步操做不就 ok 了吗？

从效果上来讲，的确是能够恢复同步，但其实没有必要。缘由是实现同步的 sync 命令是一个很是消耗资源的操做，看完下图的说明，相信你确定理解的。

既然同步是一个很是消耗资源的操做，那 Redis 有没有什么优化方法呢？答案固然是有的。

2.3 优化版同步操做

还记得上面说的内容吗 —— 2.8 版本开始，进行主从同步可能只须要执行命令传播便可。这个也是由于 sync 比较耗资源，从而采起的优化。

那何时能够这么作呢？咱们先看下前提条件：

主从同步实际分 2 种状况：

初次复制：从服务器第一次复制当前主服务器（PS：主服务器是有可能更换的）
断线后重复制：处于命令传播阶段的主从服务器，由于网络问题而中断复制，从服务器经过自动重连，从新链接上主服务器并继续复制。

在断线后重复制的状况下，在 2.8 版本以前，会再次执行同步（sync 命令）和命令传播。

若是说，在断线期间，主服务器（已有上万键值对）只执行了几个写命令，为了让从服务器弥补这几个命令，却要从新执行 sync 来生成新的 rdb 文件，这也是很是低效的。

为了解决这个问题，2.8 开始就使用 psync 命令来代替 sync 命令去执行同步操做。

psync 具备完整重同步和部分重同步两种模式：

完整重同步：用于初次复制状况，执行过程同 sync，在这不赘述了。
部分重同步：用于断线后重复制状况，若是知足必定条件，主服务器只须要将断线期间执行的写命令发送给从服务器便可。

所以很明显，当主从同步出现断线后重复制的状况，psync 的部分重同步模式能够解决 sync 的低效状况。

上面的介绍中，出现了「知足必定条件」，那又是鬼什么条件呢？—— 其实就是一个偏移量的比较，具体能够继续往下看。

2.4 部分重同步的实现

部分重同步功能由如下 3 部分组成：

主从服务器的复制偏移量
主服务器的复制积压缓冲区
服务器的运行 id（run id）

2.4.1 复制偏移量

执行复制的主从服务器都会分别维护各自的复制偏移量：

主服务器每次向从服务器传播 n 个字节数据时，都会将本身的复制偏移量加 n。
从服务器接受主服务器传来的数据时，也会将本身的复制偏移量加 n

举个例子：

若当前主服务器的复制偏移量为 10000，此时向从服务器传播 30 个字节数据，结束后复制偏移量为 10030。

这时，从服务器还没接收这 30 个字节数据就断线了，而后从新链接上以后，该从服务器的复制偏移量依旧为 10000，说明主从数据不一致，此时会向主服务器发送 psync 命令。

那么主服务器应该对从服务器执行完整重同步仍是部分重同步呢？若是执行部分重同步的话，主服务器又如何知道同步哪些数据给从服务器呢？

如下答案都和复制积压缓冲区有关

2.4.2 复制积压缓冲区

首先，复制积压缓冲区是一个固定长度，先进先出的队列，默认 1MB。

当主服务器进行命令传播时，不只会将命令发送给从服务器，还会发送给这个缓冲区。

所以复制积压缓冲区的构造是这样的：

当从服务器向主服务器发送 psync 命令时，还须要将本身的复制偏移量带上，主服务器就能够经过这个复制偏移量和复制积压缓冲区的偏移量进行对比。

若复制积压缓冲区存在从服务器的复制偏移量 + 1 后的数据，则进行部分重同步，不然进行完整重同步。

2.4.3 run id

运行 id 是在进行初次复制时，主服务器将会将本身的运行 id 发送给从服务器，让其保存起来。

当从服务器断线重连后，从服务器会将这个运行 id 发送给刚链接上的主服务器。

若当前服务器的运行 id 与之相同，说明从服务器断线前复制的服务器就是当前服务器，主服务器能够尝试执行部分同步；若不一样则说明从服务器断线前复制的服务器不是当前服务器，主服务器直接执行完整重同步。

花了不少笔墨，终于把部分重同步的实现写完了，最后补充一个辅助功能

2.5 心跳检测

刚才提到，主从同步有同步和命令传播 2 个步骤。

当完成了同步以后，主从服务器就会进入命令传播阶段，此时从服务器会以每秒 1 次的频率，向主服务器发送命令：REPLCONF ACK <replication_offset> 其中 replication_offset 是从服务器当前的复制偏移量

发送这个命令主要有三个做用：

检测主从服务器的网络状态
辅助实现 min-slaves 选项
检测命令丢失（若丢失，主服务器会将丢失的写命令从新发给从服务器）

3. 总结

发送 SLAVEOF 命令能够进行主从同步，好比：SLAVEOF 127.0.0.6379

主从同步有同步和命令传播 2 个步骤。

同步：将从服务器的数据库状态更新成主服务器当前的数据库状态（一个消耗资源的操做）
命令传播：当主服务器数据库状态被修改后，致使主从服务器数据库状态不一致，此时须要让主从数据同步到一致的过程

主从同步分初次复制和断线后重复制两种状况

从 2.8 版本开始，在出现断线后重复制状况时，主服务器会根据复制偏移量、复制积压缓冲区和 run id，来肯定执行完整重同步仍是部分重同步

2.8 版本使用 psync 命令来代替 sync 命令去执行同步操做。目的是为了解决同步（sync 命令）的低效操做。

以上就是这篇文章的所有内容了，但愿本文的内容对你们的学习或者工做具备必定的参考学习价值。