Zookeeper做为一个分布式协调系统提供了一项基本服务:分布式锁服务,分布式锁是分布式协调技术实现的核心内容。像配置管理、任务分发、组服务、分布式消息队列、分布式通知/协调等,这些应用实际上都是基于这项基础服务由用户本身摸索出来的。node
zookeeper做为分布式协调系统在大数据领域很是经常使用,它是一个很好的中心化管理工具。下面举几个常见的应用场景。网络
HA(分布式锁的应用):Master挂掉以后迅速切换到slave节点。数据结构
任务发布:regionserver挂了一台,master须要从新分配region,会把任务放在zookeeper等regionserver来获取架构
任务分配:给topic分配partitions和replication分布式
ZooKeeper命名空间中的Znode,兼具文件和目录两种特色。既像文件同样维护着数据、元信息、ACL、时间戳等数据结构,又像目录同样能够做为路径标识的一部分。 每一个Znode由3部分组成:工具
ZooKeeper中的每一个节点存储的数据要被原子性的操做。也就是说读操做将获取与节点相关的全部数据,写操做也将替换掉节点的全部数据。另外,每个节点都拥有本身的ACL(访问控制列表),这个列表规定了用户的权限,即限定了特定用户对目标节点能够执行的操做。大数据
ZooKeeper能够为全部的读操做设置watch,包括:exists()、getChildren()及getData()。当节点状态发生改变时(Znode的增、删、改)将会触发watch所对应的操做。当watch被触发时,ZooKeeper将会向客户端发送且仅发送一条通知,由于watch只能被触发一次,这样能够减小网络流量。架构设计
ZooKeeper中的节点有两种,分别为临时节点和永久节点(还可再分为有序无序)。节点的类型在建立时即被肯定,而且不能改变。设计
两种方式:server
存储集群元数据提供给client使用,体如今好比须要对HBase和Kafka操做时,都会直接连到zookeeper,zookeeper记录了数据存储的位置,存活的节点等元数据信息。
Master要监视/works和/tasks两个永久节点,以便能感知到由哪些slave当前可用,当前有新任务须要分配。
分配过程:在/assign下建立当前可用的workA,找到须要分配的taskA,建立/assign/workA/taskA
zookeeper还有不少相似的应用大多都是基于上面的特性。总的来讲,zk只是一个提供了一些特性的系统,用户根据这些特性本身定义了它的用法。熟悉了zk的操做以及应用场景,下一篇说下zk的架构设计与角色分工。
评论不能及时回复可直接加公众号提问或交流,知无不答,谢谢 。