技术分享【zookeeper】

时间 2019-12-23

原文原文链接

zookeeper简介

一、什么是zookeeper

ZooKeeper 是一个分布式的，开放源码的分布式应用程序协同服务。
ZooKeeper 的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来，构成一个高效可靠的原语集，并以一系列简单易用的接口提供给用户使用。node

二、zookeeper的使用场景

2.一、数据发布/订阅，配置中心

一、发布者将数据发布到Zookeeper的节点上，供订阅者进行数据订阅。
二、Zookeeper采用了推拉相结合的模式，客户端向服务端注册本身须要关注的节点，一旦该节点数据发生变动，那么服务端就会向相应的客户端推送Watcher事件通知，客户端接收到此通知后，主动到服务端获取最新的数据。算法

2.二、分布式锁

一、排它锁也叫独占锁
服务器

① 获取锁，在须要获取排它锁时，全部客户端经过调用接口，在/exclusive_lock节点下建立临时子节点/exclusive_lock/lock。Zookeeper能够保证只有一个客户端可以建立成功，没有成功的客户端须要注册/exclusive_lock节点监听。分布式

② 释放锁，当获取锁的客户端宕机或者正常完成业务逻辑都会致使临时节点的删除，此时，全部在/exclusive_lock节点上注册监听的客户端都会收到通知，能够从新发起分布式锁获取。ide

二、读写锁
设计

① 获取锁，在须要获取共享锁时，全部客户端都会到/shared_lock下面建立一个临时顺序节点，若是是读请求，那么就建立例如/shared_lock/host1-R-00000001的节点，若是是写请求，那么就建立例如/shared_lock/host2-W-00000002的节点。日志

② 判断读写顺序server

　　　　1. 建立完节点后，获取/shared_lock节点下全部子节点，并对该节点变动注册监听。blog

　　　　2. 肯定本身的节点序号在全部子节点中的顺序。接口

　　　　3. 对于读请求：若没有比本身序号小的子节点或全部比本身序号小的子节点都是读请求，那么代表本身已经成功获取到共享锁，同时开始执行读取逻辑，如有写请求，则须要等待。对于写请求：若本身不是序号最小的子节点，那么须要等待。

　　　　4. 接收到Watcher通知后，重复步骤1。

③ 释放锁，其释放锁的流程与独占锁一致。

两种锁如何避免羊群效应？

一、独占锁：

二、读写锁呢？

2.2.三、一主多从，master-worker协同

使用一个临时节点/master表示master。master在行使master的职能以前，首先要建立这个znode。若是能建立成功，开始行使master职能。
worker经过在/workers下面建立临时节点来加入集群
master会经过watch机制监控/workers下面的worker节点列表来实时获取worker成员的变化。

2.2.四、kafak如何使用zookeeper

一、master-worker模式
一个Kafka集群由多个broker组成，这些borker是系统中的worker。Kafka会从这些worker选举出一个 controller，这个controlle是系统中的master，负责把topic和partition分配给各个broker。
二、Topic注册
Topic的消息会被分红多个分区并将其分布在多个Broker上，这些分区信息及与Broker的对应关系也都是由Zookeeper在维护。
三、消费分区与消费者的关系，消息消费位移记录
同一个消费者组内，每一个分区只能有一个消费者进行消费，每条消息只被消费一次，因此消费者和消费分区之间的关系也写入zookeeper。

zookeeper中的重要概念

数据模型

ZooKeeper 使用文件系统模型，Datatree。Datatree 的每一个节点叫做 znode。每一个节点均可以保存数据。每一个节点都有一个版本 (version)。版本从 0 开始计数。

基于版本号的条件更新

znode节点

持久性的 znode (PERSISTENT): ZooKeeper 宕机，或者 client 宕机，这个 znode 一旦建立就不会丢失。
临时性的 znode (EPHEMERAL): ZooKeeper 宕机了，或者 client 在指定的 timeout 时间内没有链接 server ，都会被认为丢失。
znode 节点也能够是顺序性的。每个顺序性的 znode 关联一个惟一的单调递增整数。这个单调递增整数是 znode 名字的后缀。
持久顺序性的 znode(PERSISTENT_SEQUENTIAL): znode 除了具有持久性 znode 的特色以外，znode 的名字具有顺序性。
临时顺序性的 znode(EPHEMERAL_SEQUENTIAL): znode 除了具有临时性 znode 的特色以外，znode 的名字具有顺序性。

standalone 模式和 quorum模式

quorum模式要求至少3个节点

其中2181是默认客户端服务端口，3333是quorum之间的通讯，3334是用于leader选举的端口。

服务器节点角色与区别

事务日志和快照

zookeeper数据一致性

一、CAP理论下，zookeeper是如何工做的。

二、zookeeper的数据一致性

• 可线性化(Linearizable)写入:先到达 leader 的写请求会被先处理，leader 决定写请求的执行顺序。
• 客户端FIFO顺序:来自给定客户端的请求按照发送顺序执行。

三、ZAB协议

一、2PC,3PC,Paxos,Raft算法

二、ZAB（ZooKeeper Atomic Broadcast）协议

Leader发送PROPOSAL给集群中全部的节点。
节点在收到PROPOSAL以后，把PROPOSAL落盘,发送一个ACK给Leader。
Leader在收到大多数节点的ACK以后，发送COMMIT给集群中全部的节点。

Leader选举

一、Vote投票包含的信息：sid（服务器ID），zxid（事务ID），epoch（leader周期）

二、投票过程

一个ZooKeeper节点经过向全部的节点发送vote开始选举
一个节点在接收到vote以后若是发现接收到的投票新，就把本身的投票更新成最新的投票，并把vote发送给全部的ZooKeeper节点。不然的话，什么也不用作。

如何判断一个投票是新的？

一个3节点集群选举一个leader的时序图:

三、脑裂-长时间的消息发送延迟致使选举出两个leader