做者:程序员历小冰
原文:https://mp.weixin.qq.com/s/0VVYTyAI1egfs2Fxcrme3A复制代码
Redis 的复制功能分为同步( sync )和命令传播( command propagate )两个步骤:程序员
同步面试
Redis 使用 psync 命令完成主从数据同步,同步过程分为:全量复制和部分复制。数据库
全量复制:通常用于初次复制场景,它会把主节点所有数据一次性发送给从节点发送给从节点,当数据量较大时,会对主从节点和网络形成很大的开销。缓存
部分复制:用于处理在主从复制中因网络闪断等缘由形成的网络丢失场景,当从节点再次链接上主节点后,若是条件容许,主节点会补发丢失数据给从节点。由于补发的数据远远小于全量数据,能够有效避免全量复制的太高开销。bash
psync 命令运行须要如下组件支持:服务器
参与复制的从节点都会维护自身复制偏移量。主节点在处理完写命令后,会把命令的字节长度作累加记录,统计在 info replication 中的 masterreploffset 指标中。从节点在接收到主节点发送的命令后,也会累加记录自身的偏移量,而且会每秒钟上报自身的复制偏移量给主节点。经过对比主从节点的复制偏移量,能够判断主从节点数据是否一致。网络
复制积压缓冲区是保存在主节点的一个固定长度的队列,默认大小为 1MB,当主节点有链接的从节点时被建立。主节点响应写命令时,不但会把命令发送给从节点,还会写入复制积压缓冲区中。架构
复制积压缓冲区大小有限,只能保存最近的复制数据,用于部分复制和复制命令丢失时的数据补救。异步
每一个 Redis 节点启动后都会动态分配一个 40 位的十六进制字符串做为运行 ID。运行 ID 的主要做用是用来惟一标识 Redis 节点,好比说从节点保存主节点的运行 ID 来识别本身正在复制的是哪一个主节点。优化
全量同步
slaveof 命令的执行
须要注意,对于数据量较大的主节点,好比生成的 RDB 文件超过 6GB 以上时要格外当心。若是传输 RDB 的时间超过 repl-timeout 所配置的值,从节点将发起接收 RDB 文件并清理已经下载的临时文件,致使全量复制失败。
若是主节点建立和传输 RDB 的时间过长,可能会出现主节点复制客户端缓冲区溢出。默认配置为 client-output-buffer-limit slave 256MB 64MB 60,若是60s内缓冲区消耗持续大于64MB或者直接超过256MB时,主节点将直接关闭复制客户端链接,形成全量同步失败。
经过分析全量复制的全部流程,读者会发现全量复制是一个很是耗时费力的操做。它时间开销主要包括:
全量同步过程当中不只会消耗大量时间,还会进行屡次持久化相关操做和网络数据传输,这期间会大量消耗主从节点所在服务器的 CPU、内存和网络资源。因此,除了第一次复制是采用全量同步没法避免,其余场景应该规避全量复制,采起部分同步功能。
部分同步
部分复制主要是 Redis 针对全量复制的太高开销作出的一种优化措施,使用 psync {runId} {offset} 命令实现。当从节点正在复制主节点时,若是出现网络闪断或者命令丢失等异常状况时,从节点会向主节点要求补发丢失的命令数据,若是主节点的复制积压缓冲区存在这部分数据则直接发送给从节点,这样就保证了主从节点复制的一致性。补发的这部分数据通常远远小于全量数据,因此开销很小。
心跳检测
主从节点在创建复制后,它们之间维护着长链接并彼此发送心跳命令,以下图所示。
主从心跳判断机制以下所示:
replconf 命令不只能实时监测主从节点网络状态,还能上报从节点复制偏移量。主节点会根据从节点上传的偏移量检查复制数据是否丢失,若是从节点数据丢失,再从主节点的复制缓存区中拉取丢失的数据发送给该从节点。
异步复制和命令传播
主节点不但负责数据读写,还负责把写命令同步给从节点。写命令的发送过程是异步完成,也就是说主节点自身处理完写命令后直接返回给客户端,并不等待从节点复制完成。
这个异步过程由命令传播来处理,它不只会将写命令发送给全部从服务器,还会将写命令入队到复制积压缓冲区里边。