redis主从复制[总结向]

时间 2020-04-05

标签 redis 主从复制总结栏目 Redis 繁體版

原文原文链接

title: Redis主从复制git

date: 2020-03-29github

欢迎前往个人博客和专栏一块儿交流：博客｜知乎专栏

redis主从复制是高可用方案中的一部分，那主从复制是如何进行的？又是如何实现的？怎么支撑了redis的高可用性？在主从模式下Master和Slave节点分别作了哪些事情？redis

我理解的redis高可用的特色有：服务器

redis 主从复制有两个版本：旧版（Ver2.8-），新版（Ver2.8+，增长PSYNC命令来解决旧版中的问题）

讨论复制时都须要考虑两种场景：网络

固然你确定会想到若是主节点掉线，这时候会怎么样？这个场景固然也在redis高可用方案中，之时不是本文的重点，属于Sentinel机制的内容了。架构

前文说过了，旧版主从复制只有全量复制用于应付上述两个场景，所以下面的流程也只有一份：优化

从服务器向主服务器发送sync命令。
主服务器在收到sync命令以后，调用bgsave命令生成最新的rdb文件，将这个文件同步给从服务器，这样从服务器载入这个rdb文件以后，状态就会和主服务器执行bgsave命令时候的一致。
主服务器将保存在命令缓冲区中的写命令同步给从服务器，从服务器执行这些命令，这样从服务器的状态就跟主服务器当前状态一致了。

若是你不知道redis中还有个缓冲区的话，建议系统的了解下redis中缓冲区的设计。这里缓冲区特指命令缓冲区，后面还会讲到复制缓冲区。

可是这样的实如今 **场景2** 下的缺点很明显：若是说从节点断线后迅速上线，这段时间内的产生的写命令不多，却要**全量复制**主库的数据，传输了大量重复数据。spa

SYNC命令产生的消耗：设计

优势就是：简单暴力。我的看来在redis架构中不合适的用法，不表明说实际场景中也必定不合适，简单暴力也是一个很大的优势。blog

新版的主从复制跟旧版的区别就在于：对场景2的优化。

场景2的缺点上文已经提到过了，那么优化的方向就是“尽可能不使用全量复制；增长增量复制(PSYNC)的功能”。为此还要解决下列问题：

为此新版中使用了如下概念：

每一个redis服务器都有其runid，runid由服务器在启动时自动生成，主服务器会将本身的runid发送给从服务器，而从服务器会将主服务器的runid保存起来。从服务器redis断线重连以后进行同步时，就是根据runid来判断同步的进度：

主从节点，分别会维护一个复制偏移量：

主服务器每次向从服务器同步了N字节数据以后，将修改本身的复制偏移量+N。从服务器每次从主服务器同步了N字节数据以后，将修改本身的复制偏移量+N。经过对比主从节点的偏移量很容易就能够发现，主从节点是否处于一致状态。

一个固定长度（可配置）的FIFO队列，默认大小 = 1MB；预测值 = second * write_size_per_second。当从节点从新连上主节点时候，从节点会经过PSYNC命令将本身的复制偏移量（offset）发送给主服务器，主节点会根据偏移量会判断该执行何种同步：

由于复制缓冲区不可能无限大，所以为了尽量多的利用部分重同步，须要针对真实场景估算出最合适的复制缓冲区大小。

至此，redis新版PSYNC经过上述概念和流程，解决了场景2下旧版复制中的资源浪费问题，流程图和示例图见下文。

示例图以下，ABCD四个从节点，其中A执行部分中同步，D执行了完整重同步。

水平有限，若有错误，欢迎勘误指正🙏。