基于zookeeper实现分布式配置中心（一）

时间 2019-11-05

标签基于 zookeeper 实现分布式配置中心栏目 Zookeeper 繁體版

原文原文链接

　　最近在学习zookeeper，发现zk真的是一个优秀的中间件。在分布式环境下，能够高效解决数据管理问题。在学习的过程当中，要深刻zk的工做原理，并根据其特性作一些简单的分布式环境下数据管理工具。本文首先对zk的工做原理和相关概念作一下介绍，而后带你们作一个简单的分布式配置中心。html

zookeeper介绍

　　zookeeper是一个分布式协调框架，主要是解决分布式应用中常常遇到的一些数据管理问题，如：统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理、分布式锁等。node

zookeeper使用

查看节点

　　# ls /path服务器

建立节点

　　#create /path data网络

修改节点

　　#set /path data架构

删除节点

　　#delete /path并发

获取节点数据

　　#get /path框架

zookeeper C/S链接状态

　　1）KeeperState.Expired：客户端和服务器在ticktime的时间周期内，是要发送心跳通知的。这是租约协议的一个实现。客户端发送request，告诉服务器其上一个租约时间，服务器收到这个请求后，告诉客户端其下一个租约时间是哪一个时间点。当客户端时间戳达到最后一个租约时间，而没有收到服务器发来的任何新租约时间，即认为本身下线（此后客户端会废弃此次链接，并试图从新创建链接）。这个过时状态就是Expired状态分布式

　　2）KeeperState.Disconnected：就像上面那个状态所述，当客户端断开一个链接（多是租约期满，也多是客户端主动断开）这是客户端和服务器的链接就是Disconnected状态高并发

　　3）KeeperState.SyncConnected：一旦客户端和服务器的某一个节点创建链接（注意，虽然集群有多个节点，可是客户端一次链接到一个节点就好了），并完成一次version、zxid的同步，这时的客户端和服务器的链接状态就是SyncConnected工具

　　4）KeeperState.AuthFailed：ookeeper客户端进行链接认证失败时，发生该状态

zookeeper工做原理

　　文件系统 + 监听机制

文件系统特色

　　同一个目录下文件名称不能重复，一样zookeeper也是这样的，zookeeper中统一叫做znode。znode节点能够包含子znode，也能够同时包含数据。znode只适合存储很是小的数据，不能超过1M，最好都小于1K。

znode节点类型

　　临时节点（EPHEMERAL）：客户端关闭zk链接后清除

　　永久节点（persistent）：持久化节点，除非客户端主动删除

　　有编号节点（Persistent_sequential）：自动增长顺序编号的znode持久化节点

　　临时有编号（Ephemral_ sequential）：临时自动编号设置，znode节点编号会自动增长，可是会客户端链接断开而消失。分布式锁用的是这个类型的节点。

　　注：EPHEMERAL 临时类型的节点不能有子节点，对于zk来讲，有几个节点数据就会存储几份。

监听机制

　　客户端注册监听它关心的目录节点，当目录节点发生变化（数据改变、节点删除、子目录节点增长删除）时，zookeeper会通知客户端。

　　一、客户端启动时向zookeeper服务器注册信息

　　二、客户端启动同时注册一系列的Watcher类型的监听器到本地的WatchManager中

　　三、zookeeper服务器中节点发生变化后，触发watcher事件后通知给客户端，客户端线程从WatcherManager中取出对应的Watcher对象来执行回调逻辑。

zookeeper监听的事件类型

　　EventType.NodeCreated：当znode节点被建立时，该事件被触发。

　　EventType.NodeChildrenChanged：当znode节点的直接子节点被建立、被删除、子节点数据发生变动时，该事件被触发。

　　EventType.NodeDataChanged：当znode节点的数据发生变动时，该事件被触发。

　　EventType.NodeDeleted：当znode节点被删除时，该事件被触发。

　　EventType.None：当zookeeper客户端的链接状态发生变动时，即KeeperState.Expired、KeeperState.Disconnected、KeeperState.SyncConnected、KeeperState.AuthFailed状态切换时，描述的事件类型为EventType.None。

zookeeper下server工做状态

　　LOOKING：当前server不知道leader是谁，正在选举

　　LEADING：当前server即为选举出来的leader

　　FOLLOWING：leader已经选举出来，当前server是follower

ZAB协议

　　ZAB 协议全称：Zookeeper Atomic Broadcast（Zookeeper 原子广播协议）。
　　ZAB 协议做用：解决分布式数据管理一致性。
　　ZAB 协议定义：ZAB 协议是为分布式协调服务 Zookeeper 专门设计的一种支持 崩溃恢复和消息广播 协议。
　　基于该协议，Zookeeper 实现了一种主备模式的系统架构来保持集群中各个副本之间数据一致性。

消息广播

　　zookeeper集群采用主从（leader-follower）模式保证服务高可用。leader节点可读可写，follower节点只读，这种模式就须要保证leader节点和follower节点的数据一致性。对于客户端发送的写请求，所有由 Leader 接收，Leader 将请求封装成一个事务 Proposal，将其发送给全部 Follwer ，而后，根据全部 Follwer 的反馈，若是超过半数成功响应，则执行 commit 操做（先提交本身，再发送 commit 给全部 Follwer）。

　　注：上述中有一个概念：两阶段提交过程（分布式系统中数据一致性常常会涉及到的方案）。follower节点是能够处理写请求的，会转发给leader节点。leader节点经过消息广播（二阶段提交）同步写操做到follower节点，保证数据一致性。

　　zookeeper中每一个事务都对应一个ZXID（全局的、惟一的、顺序的）。ZXID 是一个 64 位的数字，其中低 32 位能够看做是一个简单的递增的计数器，针对客户端的每个事务请求，Leader 都会产生一个新的事务 Proposal 并对该计数器进行 + 1 操做。而高 32 位则表明了 Leader 服务器上取出本地日志中最大事务 Proposal 的 ZXID，并从该 ZXID 中解析出对应的 epoch 值，而后再对这个值加一。

崩溃恢复

　　即若是在消息广播的过程当中，leader死掉了，如何保证数据的一致性问题。

　　假设两种异常状况：
　　一、一个事务在 Leader 上提交了，而且过半的 Folower 都响应 Ack 了，可是 Leader 在 Commit 消息发出以前挂了。
　　二、假设一个事务在 Leader 提出以后，Leader 挂了。

　　考虑到上述两种异常状况，Zab 协议崩溃恢复要求知足如下两个要求：
　　1）确保已经被 Leader 提交的 Proposal 必须最终被全部的 Follower 服务器提交。
　　2）确保丢弃已经被 Leader 提出的可是没有被提交的 Proposal。

　　崩溃恢复主要包含：leader选举和数据恢复。

　　leader选举:

　　一、要求可用节点数量 > 总节点数量/2 。注意是 > , 不是 ≥。

　二、新选举出来的 Leader 不能包含未提交的 Proposal（新选举的 Leader 必须都是已经提交了 Proposal 的 Follower 服务器节点）、新选举的 Leader 节点中含有最大的 zxid（能够避免 Leader 服务器检查 Proposal 的提交和丢弃工做。若是zxid相同，选择server_id【zoo.cfg中的myid】最大的。）

　　数据恢复：

　　一、上面讲过了ZXID的高 32 位表明了每代 Leader 的惟一性，低 32 表明了每代 Leader 中事务的惟一性。同时，也能让 Follwer 经过高 32 位识别不一样的 Leader。简化了数据恢复流程。

　　二、基于这样的策略：当 Follower 连接上 Leader 以后，Leader 服务器会根据本身服务器上最后被提交的 ZXID 和 Follower 上的 ZXID 进行比对，比对结果要么回滚，要么和 Leader 同步。

zookeeper集群脑裂

　　集群的脑裂一般是发生在节点之间通讯不可达的状况下，集群会分裂成不一样的小集群，小集群各自选出本身的master节点，致使原有的集群出现多个master节点的状况。

zookeeper集群节点数（奇数or偶数？）

　　只要咱们清楚集群leader选举的要求（可用节点数量 > 总节点数量/2 。注意是 > , 不是 ≥），我相信很容易明白奇数节点集群相比偶数节点的集群有更大的优点。

　　一、发生脑裂（分红2个小集群）的状况下，奇数节点的集群总会有一个小集群知足可用节点数量 > 总节点数量/2，因此zookeeper集群总能选取出leader。

　　二、在容错能力相同的状况下，奇数集群更节省资源。仍是要清楚leader选举的要求哈，举个列子：3个节点的集群，若是集群能够正常工做（即leader选举成功），至少须要2个节点是正常的；4个节点的集群，若是集群能够正常工做（即leader选举成功），至少须要3个节点是正常的。那么3个节点的集群和4个节点的集群都有一个节点宕机的容错能力。很明显，在容错能力相同的状况下，奇数节点的集群更节省资源。

zookeeper和eureka对比

　　在分布式系统领域有个著名的 CAP定理（C- 数据一致性；A-服务可用性；P-服务对网络分区故障的容错性，这三个特性在任何分布式系统中不能同时知足，最多同时知足两个）。

　　zookeeper基于CP，即任什么时候刻对ZooKeeper的访问请求能获得一致的数据结果，同时系统对网络分割具有容错性；可是它不能保证每次服务请求的可用性（注：也就是在极端环境下，zookeeper可能会丢弃一些请求，消费者程序须要从新请求才能得到结果）。至于zookeeper为啥不能保证服务的高可用，你们能够想一下发生脑裂后没法选取leader、选取leader过程当中丢弃某些请求。当网络出现故障时，剩余zk集群server会发起投票选举新的leader，可是此过程会持续30~120s，此过程对于高并发来讲十分漫长，会致使整个注册服务的瘫痪，这是不可容忍的。

　　Eureka基于AP，不会有相似于ZooKeeper的选举leader的过程，采用的是Peer to Peer 对等通讯，没有leader/follower的说法，每一个peer都是对等的；客户端请求会自动切换到新的Eureka节点；当宕机的服务器从新恢复后，Eureka会再次将其归入到服务器集群管理之中。当Eureka节点接受客户端请求时，全部的操做都会在节点间进行复制（replicate To Peer）操做，将请求复制到该 Eureka Server 当前所知的其它全部节点中。至于为啥Eureka不能保证数据一致性，源于Eureka的自我保护机制：若是在15分钟内超过85%的节点都没有正常的心跳，那么Eureka就认为客户端与注册中心出现了网络故障，此时会出现如下几种状况：

　　1. Eureka再也不从注册列表中移除由于长时间没收到心跳而应该过时的服务。

　　2. Eureka仍然可以接受新服务的注册和查询请求，可是不会被同步到其它节点上(即保证当前节点依然可用) 。

　　3. 当网络稳定时，当前实例新的注册信息会被同步到其它节点中。

　　所以， Eureka能够很好的应对因网络故障致使部分节点失去联系的状况，而不会像zookeeper那样使整个注册服务瘫痪。

总结

　　以上是对zookeeper的工做原理和相关概念的一些整理，但愿能对你们认识zookeeper有所帮助。下一篇文章开始基于zookeeper作一个简单的分布式配置中心，敬请期待！！！

参考连接

　　https://blog.csdn.net/pml18710973036/article/details/64121522

　　http://www.javashuo.com/article/p-qiyvtcgr-bv.html

　　https://www.jianshu.com/p/2bceacd60b8a