ZAB是什么算法
上图显示了 Zookeeper 如何处理集群中的数据。全部客户端写入数据都是写入到 主进程(称为 Leader)中,而后,由 Leader 复制到备份进程(称为 Follower)中。从而保证数据一致性。从设计上看,和 Raft 相似。性能优化
简单介绍完,开始重点介绍 消息广播 和 崩溃恢复 。 整个 Zookeeper 就是在这两个模式之间切换。 简而言之,当 Leader 服务能够正常使用,就进入消息广播模式,当 Leader 不可用时,则进入崩溃恢复模式。服务器
消息广播架构
ZAB 协议的消息广播过程使用的是一个原子广播协议,相似一个 二阶段提交过程 。对于客户端发送的写请求,所有由 Leader 接收,Leader 将请求封装成一个事务 Proposal,将其发送给全部 Follwer ,而后,根据全部 Follwer 的反馈,若是超过半数成功响应,则执行 commit 操做(先提交本身,再发送 commit 给全部 Follwer)。并发
基本上,整个广播流程分为 3 步骤:异步
1. 将数据都复制到 Follwer 中分布式
2 . 等待 Follwer 回应 Ack,最低超过半数即成功微服务
3. 当超过半数成功回应,则执行 commit ,同时提交本身高并发
经过以上 3 个步骤,就可以保持集群之间数据的一致性。实际上,在 Leader 和 Follwer 之间还有一个消息队列,用来解耦他们之间的耦合,避免同步,实现异步解耦。源码分析
还有一些细节:
崩溃恢复
刚刚咱们说消息广播过程当中,Leader 崩溃怎么办?还能保证数据一致吗?若是 Leader 先本地提交了,而后 commit 请求没有发送出去,怎么办?
实际上,当 Leader 崩溃,即进入咱们开头所说的崩溃恢复模式(崩溃即:Leader 失去与过半 Follwer 的联系)。下面来详细讲述。
假设1:Leader 在复制数据给全部 Follwer 以后崩溃,怎么办?
假设2:Leader 在收到 Ack 并提交了本身,同时发送了部分 commit 出去以后崩溃怎么办?
针对这些问题,ZAB 定义了 2 个原则:
因此,ZAB 设计了下面这样一个选举算法: 可以确保提交已经被 Leader 提交的事务,同时丢弃已经被跳过的事务。
针对这个要求,若是让 Leader 选举算法可以保证新选举出来的 Leader 服务器拥有集群总全部机器编号(即 ZXID 最大)的事务,那么就可以保证这个新选举出来的 Leader 必定具备全部已经提交的提案。
并且这么作有一个好处是: 能够省去 Leader 服务器检查事务的提交和丢弃工做的这一步操做。
这样,咱们刚刚假设的两个问题便可以解决。假设 1 最终会丢弃调用没有提交的数据,假设 2 最终会同步全部服务器的数据。这个时候,就引出了一个问题,如何同步?
数据同步
当崩溃恢复以后,须要在正式工做以前(接收客户端请求),Leader 服务器首先确认事务是否都已经被过半的 Follwer 提交了,便是否完成了数据同步。目的是为了保持数据一致。
当全部的 Follwer 服务器都成功同步以后,Leader 会将这些服务器加入到可用服务器列表中。
实际上,Leader 服务器处理或丢弃事务都是依赖着 ZXID 的,那么这个 ZXID 如何生成呢?
答:在 ZAB 协议的事务编号 ZXID 设计中,ZXID 是一个 64 位的数字,其中低 32 位能够看做是一个简单的递增的计数器,针对客户端的每个事务请求,Leader 都会产生一个新的事务 Proposal 并对该计数器进行 + 1 操做。
而高 32 位则表明了 Leader 服务器上取出本地日志中最大事务 Proposal 的 ZXID,并从该 ZXID 中解析出对应的 epoch 值,而后再对这个值加一。
高 32 位表明了每代 Leader 的惟一性,低 32 表明了每代 Leader 中事务的惟一性。同时,也能让 Follwer 经过高 32 位识别不一样的 Leader。简化了数据恢复流程。
基于这样的策略:当 Follower 连接上 Leader 以后,Leader 服务器会根据本身服务器上最后被提交的 ZXID 和 Follower 上的 ZXID 进行比对,比对结果要么回滚,要么和 Leader 同步。
总结
ZAB 协议和咱们以前看的 Raft 协议其实是有类似之处的,好比都有一个 Leader,用来保证一致性(Paxos 并无使用 Leader 机制保证一致性)。再有采起过半即成功的机制保证服务可用(实际上 Paxos 和 Raft 都是这么作的)。
ZAB 让整个 Zookeeper 集群在两个模式之间转换,消息广播和崩溃恢复,消息广播能够说是一个简化版本的 2PC,经过崩溃恢复解决了 2PC 的单点问题,经过队列解决了 2PC 的同步阻塞问题。
而支持崩溃恢复后数据准确性的就是数据同步了,数据同步基于事务的 ZXID 的惟一性来保证。经过 + 1 操做能够辨别事务的前后顺序。
在这里给你们推荐一个Java技术交流群:710373545里面会分享一些资深架构师录制的视频资料:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化、分布式架构等这些成为架构师必备的知识体系。还能领取免费的学习资源,目前受益良多!。