一、Zookeeper节点状态
LOOKING:寻找Leader状态,处于该状态须要进入选举流程
LEADING:领导者状态,处于该状态的节点说明是角色已是Leader
FOLLOWING:跟随者状态,表示Leader已经选举出来,当前节点角色是follower
OBSERVER:观察者状态,代表当前节点角色是observer(不参与投票)面试
二、事务ID
ZooKeeper状态的每次变化都接收一个ZXID(ZooKeeper事务id)形式的标记。ZXID是一个64位的数字,由Leader统一分配,全局惟一,不断递增。 ZXID展现了全部的ZooKeeper的变动顺序。每次变动会有一个惟一的zxid,若是zxid1小于zxid2说明zxid1在zxid2以前发生。服务器
三、Zookeeper集群初始化启动时Leader选举若进行Leader选举,则至少须要两台机器,这里选取3台机器组成的服务器集群为例。 初始化启动期间Leader选举流程以下图所示。spa

在集群初始化阶段,当有一台服务器ZK1启动时,其单独没法进行和完成Leader选举,当第二台服务器ZK2启动时,此时两台机器能够相互通讯,每台机器都试图找到Leader,因而进入Leader选举过程。选举过程开始,过程以下:3d
(1) 每一个Server发出一个投票。因为是初始状况,ZK1和ZK2都会将本身做为Leader服务器来进行投票,每次投票会包含所推举的服务器的myid和ZXID,使用(myid, ZXID)来表示,此时ZK1的投票为(1, 0),ZK2的投票为(2, 0),而后各自将这个投票发给集群中其余机器。 server
(2) 接受来自各个服务器的投票。集群的每一个服务器收到投票后,首先判断该投票的有效性,如检查是不是本轮投票、是否来自LOOKING状态的服务器。 blog
(3) 处理投票。针对每个投票,服务器都须要将别人的投票和本身的投票进行比较,规则以下 事务
· 优先检查ZXID。ZXID比较大的服务器优先做为Leader。 class
· 若是ZXID相同,那么就比较myid。myid较大的服务器做为Leader服务器。 集群
对于ZK1而言,它的投票是(1, 0),接收ZK2的投票为(2, 0),首先会比较二者的ZXID,均为0,再比较myid,此时ZK2的myid最大,因而ZK2胜。ZK1更新本身的投票为(2, 0),并将投票从新发送给ZK2。 zookeeper
(4) 统计投票。每次投票后,服务器都会统计投票信息,判断是否已经有过半机器接受到相同的投票信息,对于ZK一、ZK2而言,都统计出集群中已经有两台机器接受了(2, 0)的投票信息,此时便认为已经选出ZK2做为Leader。
(5) 改变服务器状态。一旦肯定了Leader,每一个服务器就会更新本身的状态,若是是Follower,那么就变动为FOLLOWING,若是是Leader,就变动为LEADING。当新的Zookeeper节点ZK3启动时,发现已经有Leader了,再也不选举,直接将直接的状态从LOOKING改成FOLLOWING。
四、Zookeeper集群运行期间Leader从新选在Zookeeper运行期间,若是Leader节点挂了,那么整个Zookeeper集群将暂停对外服务,进入新一轮Leader选举。 假设正在运行的有ZK一、ZK二、ZK3三台服务器,当前Leader是ZK2,若某一时刻Leader挂了,此时便开始Leader选举。选举过程以下图所示。

(1) 变动状态。Leader挂后,余下的非Observer服务器都会讲本身的服务器状态变动为LOOKING,而后开始进入Leader选举过程。
(2) 每一个Server会发出一个投票。在运行期间,每一个服务器上的ZXID可能不一样,此时假定ZK1的ZXID为124,ZK3的ZXID为123;在第一轮投票中,ZK1和ZK3都会投本身,产生投票(1, 124),(3, 123),而后各自将投票发送给集群中全部机器。
(3) 接收来自各个服务器的投票。与启动时过程相同。
(4) 处理投票。与启动时过程相同,因为ZK1事务ID大,ZK1将会成为Leader。
(5) 统计投票。与启动时过程相同。
(6) 改变服务器的状态。与启动时过程相同。
华为面试题:
举例,初始状况下5台机器,sid分别为一、二、三、四、5,逻辑时钟都是0。依次启动后,开始选举,全部的机器逻辑时钟自增为1。通过屡次投票,假设第三台机器为leader,其余4台机器为follower,此时5台机器的逻辑时钟都为1。
通常状况下,逻辑时钟应该都是相同的。可是,因为一些机器崩溃的问题,是可能出现逻辑时钟不一致的状况的。例如,上例中,sid=3的机器为leader。以后某一刻,sid为一、3的机器崩溃,zookeeper仍然能够正常对外提供服务。但须要从新选主,剩下的二、四、5从新投票选主,假设sid=5成为新的leader,逻辑时钟自增,由1变成2。以后某一刻,sid为5的机器奔溃,sid为1的机器复活,仍然有3台机器运行,zookeeper能够对外提供服务,但须要从新选主。从新选主,逻辑时钟自增,这时sid为二、4的机器的逻辑时钟是由2自增为3,而sid为1的机器的逻辑时钟是由1自增为2。这种状况下,就出现了逻辑时钟不一致的状况。这时,须要清除sid为1的机器内部的投票数据,由于这些投票数据都是过期的数据。