做者:五色花的博客
来源: https://www.cnblogs.com/luao/...
本文大纲html
1、复制过程redis
Step 1:从节点执行 slaveof 命令。segmentfault
Step 2:从节点只是保存了 slaveof 命令中主节点的信息,并无当即发起复制。缓存
Step 3:从节点内部的定时任务发现有主节点的信息,开始使用 socket 链接主节点。安全
Step 4:链接创建成功后,发送 ping 命令,但愿获得 pong 命令响应,不然会进行重连。网络
Step 5:若是主节点设置了权限,那么就须要进行权限验证,若是验证失败,复制终止。异步
Step 6:权限验证经过后,进行数据同步,这是耗时最长的操做,主节点将把全部的数据所有发送给从节点。socket
Step 7:当主节点把当前的数据同步给从节点后,便完成了复制的创建流程。接下来,主节点就会持续的把写命令发送给从节点,保证主从数据一致性。大数据
2、数据间的同步优化
上面说的复制过程,其中有一个步骤是“同步数据集”,这个就是如今讲的“数据间的同步”。
redis 同步有 2 个命令:sync 和 psync,前者是 redis 2.8 以前的同步命令,后者是 redis 2.8 为了优化 sync 新设计的命令。咱们会重点关注 2.8 的 psync 命令。
一、psync命令须要3个组件支持
二、主从节点各自复制偏移量
三、主节点复制积压缓冲区
四、主节点运行ID
五、若是在重启时不改变运行ID呢?
六、psync命令的使用方式
七、psync执行流程
流程说明:
从节点发送 psync 命令给主节点,runId 就是目标主节点的 ID,若是没有默认为 -1,offset 是从节点保存的复制偏移量,若是是第一次复制则为 -1.主节点会根据 runid 和 offset 决定返回结果:
到这里,数据之间的同步就讲的差很少了,篇幅仍是比较长的。主要是针对 psync 命令相关之间的介绍。
3、全量复制
全量复制是 Redis 最先支持的复制方式,也是主从第一次创建复制时必须经历的的阶段。触发全量复制的命令是 sync 和 psync。以前说过,这两个命令的分水岭版本是 2.8,redis 2.8 以前使用 sync 只能执行全量不一样,2.8 以后同时支持全量同步和部分同步。
流程以下:
Step 1:发送 psync 命令(spync ?-1)
Step 2:主节点根据命令返回 FULLRESYNC
Step 3:从节点记录主节点 ID 和 offset
*Step 4:主节点 bgsave 并保存 RDB 到本地*
*Step 5:主节点发送 RBD 文件到从节点*
*Step 6:从节点收到 RDB 文件并加载到内存中*
Step 7:主节点在从节点接受数据的期间,将新数据保存到“复制客户端缓冲区”,当从节点加载 RDB 完毕,再发送过去。(若是从节点花费时间过长,将致使缓冲区溢出,最后全量同步失败)
*Step 8:从节点清空数据后加载 RDB 文件,若是 RDB 文件很大,这一步操做仍然耗时,若是此时客户端访问,将致使数据不一致,可使用配置slave-server-stale-data 关闭. *
*Step 9:从节点成功加载完 RBD 后,若是开启了 AOF,会马上作 bgrewriteaof。*
以上加粗的部分是整个全量同步耗时的地方。
注意:
4、部分复制
当从节点正在复制主节点时,若是出现网络闪断和其余异常,从节点会让主节点补发丢失的命令数据,主节点只须要将复制缓冲区的数据发送到从节点就可以保证数据的一致性,相比较全量复制,成本小不少。
5、心跳
主从节点在创建复制后,他们之间维护着长链接并彼此发送心跳命令。
心跳的关键机制以下:
注意:
为了下降主从延迟,通常把 redis 主从节点部署在相同的机房/同城机房,避免网络延迟带来的网络分区形成的心跳中断等状况。
6、异步复制
主节点不但负责数据读写,还负责把写命令同步给从节点,写命令的发送过程是异步完成,也就是说主节点处理完写命令后当即返回客户度,并不等待从节点复制完成。
异步复制的步骤很简单,以下:
Step 1:主节点接受处理命令。
Step 2:主节点处理完后返回响应结果 。
Step 3:对于修改命令,异步发送给从节点,从节点在主线程中执行复制的命令。
7、总结
本文主要分析了 Redis 的复制原理,包括复制过程,数据之间的同步,全量复制的流程,部分复制的流程,心跳设计,异步复制流程。
其中,能够看出,RDB 数据之间的同步很是耗时。
因此,Redis 在 2.8 版本退出了相似增量复制的 psync 命令,当 Redis 主从直接发生了网络中断,不会进行全量复制,而是将数据放到缓冲区(默认 1MB)里,再经过主从之间各自维护复制 offset 来判断缓存区的数据是否溢出。若是没有溢出,只须要发送缓冲区数据便可,成本很小;反之,则要进行全量复制。所以控制缓冲区大小很是的重要。
若有错误或其它问题,欢迎小伙伴留言评论、指正。若有帮助,欢迎点赞+转发分享。
欢迎你们关注民工哥的公众号:民工哥技术之路