1)半数机制(Paxos 协议):集群中半数以上机器存活,集群可用。因此zookeeper适合装在奇数台机器上。html
2)Zookeeper虽然在配置文件中并无指定master和slave。可是,zookeeper工做时,是有一个节点为leader,其余则为follower,Leader是经过内部的选举机制临时产生的node
3)以一个简单的例子来讲明整个选举的过程。服务器
假设有五台服务器组成的zookeeper集群,它们的id从1-5,同时它们都是最新启动的,也就是没有历史数据,在存放数据量这一点上,都是同样的。假设这些服务器依序启动,来看看会发生什么。网络
(1)服务器1启动,此时只有它一台服务器启动了,它发出去的报没有任何响应,因此它的选举状态一直是LOOKING状态。session
(2)服务器2启动,它与最开始启动的服务器1进行通讯,互相交换本身的选举结果,因为二者都没有历史数据,因此id值较大的服务器2胜出,可是因为没有达到超过半数以上的服务器都赞成选举它(这个例子中的半数以上是3),因此服务器1、2仍是继续保持LOOKING状态。分布式
(3)服务器3启动,根据前面的理论分析,服务器3成为服务器1、2、3中的老大,而与上面不一样的是,此时有三台服务器选举了它,因此它成为了此次选举的leader。大数据
(4)服务器4启动,根据前面的分析,理论上服务器4应该是服务器1、2、3、4中最大的,可是因为前面已经有半数以上的服务器选举了服务器3,因此它只能接收当小弟的命了。ui
(5)服务器5启动,同4同样当小弟。url
1)Znode有两种类型:spa
短暂(ephemeral):客户端和服务器端断开链接后,建立的节点本身删除
持久(persistent):客户端和服务器端断开链接后,建立的节点不删除
2)Znode有四种形式的目录节点(默认是persistent )
(1)持久化目录节点(PERSISTENT)
客户端与zookeeper断开链接后,该节点依旧存在
(2)持久化顺序编号目录节点(PERSISTENT_SEQUENTIAL)
客户端与zookeeper断开链接后,该节点依旧存在,只是Zookeeper给该节点名称进行顺序编号
(3)临时目录节点(EPHEMERAL)
客户端与zookeeper断开链接后,该节点被删除
(4)临时顺序编号目录节点(EPHEMERAL_SEQUENTIAL)
客户端与zookeeper断开链接后,该节点被删除,只是Zookeeper给该节点名称进行顺序编号
3)建立znode时设置顺序标识,znode名称后会附加一个值,顺序号是一个单调递增的计数器,由父节点维护
4)在分布式系统中,顺序号能够被用于为全部的事件进行全局排序,这样客户端能够经过顺序号推断事件的顺序
1)czxid- 引发这个znode建立的zxid,建立节点的事务的zxid
每次修改ZooKeeper状态都会收到一个zxid形式的时间戳,也就是ZooKeeper事务ID。
事务ID是ZooKeeper中全部修改总的次序。每一个修改都有惟一的zxid,若是zxid1小于zxid2,那么zxid1在zxid2以前发生。
2)ctime - znode被建立的毫秒数(从1970年开始)
3)mzxid - znode最后更新的zxid
4)mtime - znode最后修改的毫秒数(从1970年开始)
5)pZxid-znode最后更新的子节点zxid
6)cversion - znode子节点变化号,znode子节点修改次数
7)dataversion - znode数据变化号
8)aclVersion - znode访问控制列表的变化号
9)ephemeralOwner- 若是是临时节点,这个是znode拥有者的session id。若是不是临时节点则是0。
10)dataLength- znode的数据长度
11)numChildren - znode子节点数量
1)监听原理详解:
1)首先要有一个main()线程
2)在main线程中建立Zookeeper客户端,这时就会建立两个线程,一个负责网络链接通讯(connet),一个负责监听(listener)。
3)经过connect线程将注册的监听事件发送给Zookeeper。
4)在Zookeeper的注册监听器列表中将注册的监听事件添加到列表中。
5)Zookeeper监听到有数据或路径变化,就会将这个消息发送给listener线程。
6)listener线程内部调用了process()方法。
2)常见的监听
(1)监听节点数据的变化:
get path [watch]
(2)监听子节点增减的变化
ls path [watch]
ZooKeeper 的写数据流程主要分为如下几步:
1)好比 Client 向 ZooKeeper 的 Server1 上写数据,发送一个写请求。
2)若是Server1不是Leader,那么Server1 会把接受到的请求进一步转发给Leader,由于每一个ZooKeeper的Server里面有一个是Leader。这个Leader 会将写请求广播给各个Server,好比Server1和Server2, 各个Server写成功后就会通知Leader。
3)当Leader收到大多数 Server 数据写成功了,那么就说明数据写成功了。若是这里三个节点的话,只要有两个节点数据写成功了,那么就认为数据写成功了。写成功以后,Leader会告诉Server1数据写成功了。
4)Server1会进一步通知 Client 数据写成功了,这时就认为整个写操做成功。ZooKeeper 整个写数据流程就是这样的。
本教程由尚硅谷教育大数据研究院出品,如需转载请注明来源,欢迎你们关注尚硅谷公众号(atguigu)了解更多。