前面几篇内容咱们都是在一台 Redis 服务器上进行操做,包括数据的读、写以及备份操做。本篇要介绍的主从复制,是指将一台 Redis 服务器的数据,复制到其余 Redis 服务器,咱们将前者称为主节点 master,将后者称为从节点 slave。在这个过程当中,数据的复制是单向的,即只能从主节点到从节点。 在默认状况下,咱们开启的每台 Redis 服务器都是独立的主节点,在主从复制中,一个主节点能够有多个从节点,但一个从节点只能有一个主节点。以下图所示:web
graph TB;
A(master)-->B(slave1)
A-->C(slave2)
A-->D(......)
复制代码
主从复制的做用主要包括:redis
主从复制的实现过程大体能够分为3个阶段:创建链接、数据同步、命令传播。数据库
在实现主从复制的第一步固然是主从节点之间创建链接,这一阶段也能够称为准备阶段,主要包含了如下几个步骤:windows
保存主节点信息缓存
从节点服务器内部包含了 masterhost 和 masterport 字段,分别存储了主节点的 IP 和 port 信息。slaveof 是异步命令,从节点完成主节点 IP 和 port 的保存后,向发送 slaveof 命令的客户端直接返回 OK,实际的复制操做在这以后才开始进行。 安全
创建 socket 链接服务器
从节点每秒调用 1 次复制定时函数 replicationCron(),若是发现了有主节点能够链接,便会根据主节点的 IP 和 port,建立 socket 链接。链接成功后从节点会为该 socket 创建一个专门处理复制工做的文件事件处理器,负责后续的复制工做,如接收 RDB 文件、接收命令传播等;主节点在接收到从节点的 socket 链接后(即 accept 以后),为该 socket 建立相应的客户端状态,并将从节点看作是链接到主节点的一个客户端,后面的步骤会以从节点向主节点发送命令请求的形式来进行。 网络
发送 ping 命令并发
从节点成为主节点的客户端以后,发送 ping 命令进行首次请求,目的是检查 socket 链接是否可用,以及主节点当前是否可以处理请求。从节点发送 ping 命令后,可能出现 3 种状况:负载均衡
身份验证
若是从节点中配置文件中设置了 masterauth 选项,则从节点须要向主节点进行身份验证;没有设置该选项,则不须要验证。从节点进行身份验证是经过向主节点发送 auth 命令进行的,auth 命令的参数即为配置文件中的 masterauth 的值。若是主节点设置密码的状态与从节点 masterauth 的状态一致(一致是指都存在,且密码相同,或者都不存在),则身份验证经过,复制过程继续;若是不一致,则从节点断开 socket 链接,并重连。
发送从节点端口信息
身份验证以后,从节点会向主节点发送其监听的端口号,主节点将该信息保存到该从节点对应的客户端的 slave_listening_port 字段中。该端口信息除了在主节点中执行 info replication 命令时显示之外,没有其余做用。
在主从节点之间创建链接以后,就能够开始进行数据的同步,这一阶段也能够理解是从节点中数据的初始化。 Redis 的数据同步有两个重要的命令:sync 和 psync,sync 命令是 Redis2.8 之前请求同步数据的命令,同步方式是全量复制;psync 命令是 Redis2.8 算是对 sync 优化后的命令,同步方式能够是全量复制或增量复制。 这里提到两个数据同步的关键:全量复制和增量复制,先作个简单介绍:
若是网络中断的时间过长,会致使主节点没有可以完整地保存中断期间执行的写命令,则没法进行增量复制,仍使用全量复制。
在讲解 psync 命令以前,咱们先讲几个须要知道的概念:
复制偏移量 ( offset )
主节点和从节点会各自维护一个复制偏移量 ( offset ),表明的是主节点向从节点传递的字节数。主节点每次向从节点传播 N 个字节数据时,主节点的 offset 增长 N;同理,当从节点每次收到主节点传来的 N 个字节数据时,从节点的 offset 增长 N。offset 的值咱们能够经过 info replication 命令返回的信息中看到。经过比较主节点和从节点的 offset 能够判断数据库状态是否一致,若是二者的 offset 相同,则一致,不然不一致;也能够根据二者的 offset 找出从节点缺乏的数据。
复制积压缓存区
复制积压缓存区是由主节点维护的一个固定长度的先进先出 ( FIFO) 队列,默认大小是 1MB。当主节点开始有从节点时,主节点建立复制积压缓存区,其做用是备份主节点最近发送给从节点的数据。 在命令传播阶段,主节点除了将写命令发送给从节点,还会发送一份给复制积压缓冲区,做为写命令的备份;除了存储写命令,复制积压缓冲区中还存储了其中的每一个字节对应的复制偏移量 ( offset )。因为复制积压缓冲区定长且是先进先出,因此它保存的是主节点最近执行的写命令;时间较早的写命令会被挤出缓冲区。 因为该缓冲区长度固定且有限,所以能够备份的写命令也有限,当主从节点 offset 的差距过大超过缓冲区长度时,将没法执行增量复制,只能执行全量复制。所以从节点将 offset 发送给主节点后,主节点根据 offset 和缓冲区大小决定可否执行增量复制:
服务器运行ID ( runid )
不管是主节点仍是从节点,在启动时都会自动生成一个随机 ID ( runid ),由 40 个随机的十六进制字符组成且每次启动都不同。若是使用 IP 和 port 的方式识别一个节点,那么当主节点重启修改了 RDB/AOF 数据,从节点再基于偏移量进行复制将是不安全的,所以 runid 的主要做用是惟一识别一个 Redis 节点。经过 info server 命令能够查看节点的 runid。 主从节点初次复制时,主节点将本身的 runid 发送给从节点,从节点将这个 runid 保存起来;当断线重连时,从节点会将这个 runid 发送给主节点;主节点根据发送来的 runid 和当前本身的 runid 是否相同判断可否进行增量复制:
psync 命令的格式:psync < runid > < offset > psync 的执行流程:
首先从节点根据是否执行过 slaveof 命令决定如何调用 psync 命令:
主节点根据收到的 psync 命令以及当前服务器的状态,决定执行全量复制仍是增量复制:
全量复制是主从节点第一次创建主从复制关系时必须经历的阶段,复制流程以下:
经过全量复制的过程能够看出,整个过程是十分消耗资源和时间的:
当从节点正在复制主节点时出现网络异常或其余异常,从节点会请求主节点补发缺失的命令数据,主节点只须要将复制积压缓冲区的数据发送到从节点便可。相比于全量复制,增量复制的成本代价小不少,其流程以下:
数据同步阶段完成后,主从节点进入命令传播阶段;在这个阶段主节点将本身执行的写命令发送给从节点,从节点接收命令并执行,从而保证主从节点数据的一致性。 在命令传播阶段,除了发送写命令,主从节点还维持着心跳机制:PING 和 REPLCONF ACK。心跳机制对于主从复制的超时判断、数据安全等有做用。 每隔指定的时间,主节点会向从节点发送 PING 命令,做用主要是让从节点进行超时判断。PING 命令的发送频率由 repl-ping-slave-period 参数控制,单位是秒,默认值是 10s。 从节点会向主节点发送 REPLCONF ACK 命令,频率是每秒 1 次,命令的格式为:REPLCONF ACK < offset >,其中 offset 是从节点中保存的复制偏移量。 REPLCONF ACK命令的做用包括:
实时监测主从节点网络状态:该命令会被主节点用于复制超时的判断。此外,在主节点中使用 info replication 命令能够看到其从节点的状态中的 lag 值,表明的是主节点上次收到该 REPLCONF ACK 命令的时间间隔,在正常状况下,该值应该是 0 或 1。
检测命令丢失:从节点发送了自身保存的 offset,主节点会与本身的 offset 进行对比,若是从节点数据缺失(如网络丢包),主节点会推送缺失的数据(这里也会利用复制积压缓冲区)。
offset 和复制积压缓冲区,不只能够用于增量复制,也能够用于处理命令丢失等情形;区别在于前者是在断线重连后进行的,然后者是在主从节点没有断线的状况下进行的。
辅助保证从节点的数量和延迟:主节点中使用 min-slaves-to-write 和 min-slaves-max-lag 参数,来保证主节点在不安全的状况下不会执行写命令;所谓不安全,是指从节点数量太少或延迟太高。
例如 min-slaves-to-write 和 min-slaves-max-lag 分别是 3 和 10,含义是若是从节点数量小于 3 个,或全部从节点的延迟值都大于 10s,则主节点拒绝执行写命令。而这里从节点延迟值的获取,就是经过主节点接收到 REPLCONF ACK 命令的时间来判断的,即前面所说的 info Replication中的 lag 值。
下面简单演示一下如何实现 Redis 主从复制,这里我是在一台机器上模拟多个 Redis 服务器,与实际生产环境相比,基本配置大体相同,关键都在于 IP 地址和端口号变化。
首先将 redis 文件夹复制两份做为两个从节点,复制在同一文件下便可,命名自定,这里我分别重命名为 redis_slave1 和 redis_slave2。
主从复制的开启是从从节点发起的,不须要咱们对主节点作任何事情,所以咱们对 slave 文件的配置文件进行修改,这里咱们须要修改的配置文件有两个:redis.windows.conf 和 redis.windows-service.conf。
从节点开启主从配置,有 3 种方式:
这里咱们修改 redis_slave1 的配置文件来开启主从复制,对于 redis_slave2,则用客户端命令的方式,启动命令方式和客户端命令方式差很少,感兴趣的能够本身试一试。下面以 redis_slave1 的配置文件为例:
从上面两张图中,咱们将 slave1 的端口号改成 6380,并从属于 6379端口即主节点。对于 slave2,咱们仅仅将端口号改成 6381。
无论修改 slave1 仍是 slave2 的配置文件,redis.windows.conf 和 redis.windows-service.conf 这两个配置文件都要进行修改。
修改好配置文件后,咱们分别打开三个 Redis 服务端和客户端。咱们先打开主节点的服务端再打开 slave1 和 slave2 的服务端。当咱们打开 salve1 时,能够观察到服务端发生变化。
从以上两图中的红框部分,能够发现打开 slave1 以后就开启了主从复制,而且 slave1 对主节点进行了同步数据。接下来咱们看看打开 slave2 以后有没有什么变化。
仅仅是正常打开服务端,并无对主节点形成什么影响。 除了看服务端的变化,咱们也可使用 info replication 命令在客户端查看不一样之处。
从以上三张图中,咱们也能够看出端口 6379 和 6380 创建了主从复制关系,且显示了一些信息。而端口 6381 的角色为 master,是一个独立的主节点。 接着咱们使用客户端命令的方式让端口 6381 从属于端口 6379,并观察两个端口的服务端发生的变化。
当咱们在 slave2 的客户端使用 slaveof 127.0.0.1 6379 命令创建主从关系后能够在主从服务器端看到成功开启主从复制的信息。在主从客户端查看节点角色也能够发现,slave2 的角色变成了 slave,主节点的从节点数量变成 2,且多了 slave2 的简要信息。至此,咱们就创建了一个一主二从的主从复制关系。
已经创建了一主二从的主从复制关系,接下来咱们作一些简单的测试,以便对主从复制有更好的理解。
增量复制
当主节点进行写操做后,从节点可否获取刚刚写入的数据吗? 由上图可见,从节点是能够获取到的。
全量复制
当从节点暂时断开主从关系,从新链接后是否可以获取断开期间主节点写入的数据? 咱们先在主节点中清空数据,再使用 slaveof no one 命令断开 master 和 slave2 之间的主从关系,随后 master 写入 k1,k2 数据,当 slave2 从新与 master 创建主从关系后查看是否有刚刚写入的数据。 从上图中,咱们能够看到从新创建主从关系以后,从节点也会将数据复制过来。
主从读写分离
主节点能够执行写操做,从节点能够执行写操做吗,主节点也能够进行读操做吗? 主节点能够执行读写操做,但当咱们想在 salve1 中执行 set 命令时却出现了报错,说明从节点只能进行读操做,主从节点之间作到了读写分离。 从节点是否可以实现写操做呢?事实上是能够的,在配置文件中经过 slave-read-only 控制了从节点的写权限,进行更改后就能够进行写操做,可是从节点添加的数据主节点是获取不到的。不过并不建议更改,不然就偏离了主从复制的初衷(PS:手痒的能够试试)。
主节点宕机
当主节点退出服务端和客户端后,两个从节点的角色会发生变化吗? 当咱们用 shutdown 命令让主节点宕机后,再用 info replication 命令查看 slave1 和 slave2,能够看到两个从节点的角色都还是 slave。
主节点宕机后恢复
当主节点从宕机恢复后,主节点的角色是否还是 master?
从以上两图能够看出当咱们从新打开主节点的服务端和客户端,两个从节点马上发起了主从复制请求并成功创建主从关系,主节点的角色也仍旧是 master。
使用配置文件方式配置的主从关系是持久性的,即当你配置的主从服务端开启时会自动创建起主从关系,而启动命令方式和客户端命令方式是短暂性创建主从复制。
本篇主要讲述了 Redis 主从复制的实现原理和简单的具体实现例子。主从复制在必定程度上解决了主节点的单点故障问题,当主节点故障时,能够从从节点上保障数据的读取以及找回数据的可能性;可是因为全部的写操做都是在主节点上进行,而后同步到从节点上,这必然会出现必定的延时问题,且当系统任务繁重或从节点数量过多时,问题会更显著。
本文使用 mdnice 排版