Apache ZooKeeper是一个开源的分布式服务框架,为分布式应用提供协调服务,用来解决分布式应用中的数据管理问题,如:配置管理、域名服务、分布式同步、集群管理等
官网 https://zookeeper.apache.org/
ZooKeeper视频教程 http://edu.51cto.com/course/16190.htmlhtml
主要包括两部分:文件系统、通知机制java
ZooKeeper维护一个相似Linux文件系统的数据结构,用于存储数据node
节点类型有四种:算法
持久化目录节点 persistent数据库
客户端与服务器断开链接,该节点仍然存在apache
持久化顺序编号目录节点 persistent_sequential数组
客户端与服务器断开链接,该节点仍然存在,此时节点会被顺序编号,如:00000一、000002.....bash
临时目录节点 ephemeral服务器
客户端与服务器断开链接,该节点会被删除session
临时顺序编号目录节点 ephemeral_sequential
客户端与服务器断开链接,该节点会被删除,此时节点会被顺序编号,如:00000一、000002.....
ZooKeeper是一个基于观察者模式设计的分布式服务管理框架
简单来讲,客户端注册监听它关心的目录节点,当目录节点发生变化时,ZooKeeper会通知客户端
ZooKeeper是一个订阅中心(注册中心)
场景:集群环境、服务器的许多配置都是相同的,如:数据库链接信息,当须要修改这些配置时必须同时修改每台服务器,很麻烦
解决:把这些配置所有放到ZooKeeper上,保存在ZooKeeper的某个目录节点中,而后全部的应用程序(客户端)对这个目录节点进行监视Watch,一旦配置信息发生变化,ZooKeeper会通知每一个客户端,而后从ZooKeeper获取新的配置信息,并应用到系统中。
场景:集群环境下,如何知道有多少台机器在工做?是否有机器退出或加入?须要选举一个总管master,让总管来管理集群
解决:在父目录GroupMembers下为全部机器建立临时目录节点,而后监听父目录节点的子节点变化,一旦有机器挂掉,该机器与ZooKeeper的链接断开,其所建立的临时目录节点被删除,全部其余机器都会收到通知。当有新机器加入时也是一样的道理。
选举master:为全部机器建立临时顺序编号目录节点,给每台机器编号,而后每次选取编号最小的机器做为master
ZooKeeper自己是不提供负载均衡策略的,须要本身实现,因此准确的说,是在负载均衡中使用ZooKeeper来作集群的协调(也称为软负载均衡)
实现思路:
实际上利用了ZooKeeper的特性,将ZooKeeper用为服务的注册和变动通知中心
ZooKeeper通常都运行在Linux平台
步骤:
解压zookeeper-3.4.13.tar.gz
cd ~/software tar -zxf zookeeper-3.4.13.tar.gz
配置
# 建立存放数据文件的目录 cd zookeeper-3.4.13/ mkdir data # 建立配置文件 cd conf cp zoo_sample.cfg zoo.cfg # 默认使用的是zoo.cfg,名称固定 # 修改配置文件 vi zoo.cfg dataDir=../data # 指定数据存放目录
启动zookeeper
cd bin ./zkServer.sh start | stop | status | restart # 启动|中止|查看状态|重启
客户端链接zookeeper
./zkCli.sh # 启动客户端,默认链接本机的2181端口 或 ./zkCli.sh -server 服务器地址:端口 # 链接指定主机、指定端口的zookeeper quit # 退出客户端
配置项 | 含义 | 说明 |
---|---|---|
tickTime=2000 | 心跳时间 | 维持心跳的时间间隔,单位是毫秒<br>在zookeeper中全部的时间都是以这个时间为基础单元,进行整数倍配置 |
initLimit=10 | 初始通讯时限 | 用于zookeeper集群,此时有多台zookeeper服务器,其中一个为Leader,其余都为Follower |
syncLimit=5 | 同步通讯时限 | 在运行时Leader经过心跳检测与Follower进行通讯,若是超过syncLimit*tickTime时间还未收到响应,则认为该Follower已经宕机 |
dataDir=../data | 存储数据的目录 | 数据文件也称为snapshot快照文件 |
clientPort=2181 | 端口号 | 默认为2181 |
maxClientCnxns=60 | 单个客户端的最大链接数限制 | 默认为60,能够设置为0,表示没有限制 |
autopurge.snapRetainCount=3 | 保留文件的数量 | 默认3个 |
autopurge.purgeInterval=1 | 自动清理快照文件和事务日志的频率 | 默认为0,表示不开启自动清理,单位是小时 |
dataLogDir= | 存储日志的目录 | 未指定时日志文件也存放在dataDir中,为了性能最大化,通常建议把dataDir和dataLogDir分别放到不一样的磁盘上 |
命令 | 做用 | 说明 |
---|---|---|
help | 查看帮助 | 查看全部操做命令 |
ls 节点路径 | 查看指定节点下的内容 | |
ls2 节点路径 | 查看指定节点的详细信息 | 查看全部子节点和当前节点的状态 |
create 节点路径 内容 | 建立普通节点 | 若是内容中有空格,则须要使用对双引号引发来 |
get 节点路径 | 获取节点中的值 | |
create -e 节点路径 内容 | 建立临时节点 | 当链接断开后,节点会被自动删除 |
create -s 节点路径 内容 | 建立顺序编号节点 | 即带序号的节点 |
delete 节点路径 | 删除节点 | 只能删除空节点,即不能有子节点 |
rmr 节点路径 | 递归删除节点 | remove recursion |
stat 节点路径 | 查看节点状态 | |
set 节点路径 新值 | 修改节点内容 |
查看指定节点的详细信息: ls2 /
# 子节点名称数组 [zookeeper] # -----------节点的状态信息,也称为stat结构体------------------- # 建立该znode的事务的zxid(ZooKeeper Transaction ID) # 事务ID是ZooKeeper为每次更新操做/事务操做分配一个全局惟一的id,表示zxid,值越小,表示越先执行 cZxid = 0x0 # 0x0表示十六进制数0 # 建立时间 ctime = Thu Jan 01 08:00:00 CST 1970 # 最后一次更新的zxid mZxid = 0x0 # 最后一次更新的时间 mtime = Thu Jan 01 08:00:00 CST 1970 # 最后更新的子节点的zxid pZxid = 0x0 # 子节点的变化号,表示子节点被修改的次数,-1表示从未被修改过 cversion = -1 # 当前节点的变化号,0表示从未被修改过 dataVersion = 0 # 访问控制列表的变化号 access control list aclVersion = 0 # 若是临时节点,表示当前节点的拥有者的sessionId # 若是不是临时节点,则值为0 ephemeralOwner = 0x0 # 数据长度 dataLength = 0 # 子节点数据 numChildren = 1
顺序编号节点:
步骤:
准备多台ZooKeeper服务器
配置ZooKeeper服务器
在每台服务器的conf/zoo.cfg文件中添加以下内容:
server.20=192.168.4.20:2888:3888 server.21=192.168.4.21:2888:3888 server.22=192.168.4.22:2888:3888
格式:server.A=B:C:D
建立myid配置文件
在集群环境下,须要在dataDir
目录中建立一个名为myid
的文件,文件内容是当前服务器的编号ID,即上面配置的A
cd data echo A的值 > myid
ZooKeeper启动时会读取这个文件,将里面的数字与zoo.cfg中配置的server.A进行比较,从而判断这台服务器是哪一个
测试集群环境
启动全部ZooKeeper服务器,查看状态
此时在某台服务器上执行更新操做时,其余服务器也会同步
ZooKeeper在提供服务时会自动选举一个节点服务器做为Leader,其余都是Follower
选举流程:
总结:
集群数/2+1
个服务器中,id值最大的会成为Leader# 在集群的A服务器,监听某个节点值的变化 get /yyy watch # 在集群的B服务器,修改对应节点的值 set /yyy myyyy # 此时A服务器会收到事件NodeDataChanged WATCHER:: WatchedEvent state:SyncConnected type:NodeDataChanged path:/yyy
监听Watch事件是一个一次性的触发器,当数据改变时只会触发一次,若是之后这个数据再发生改变,则不会再次触发
# 在集群的A服务器,监听某个节点的子节点的变化 ls /yyy watch # 在集群的B服务器,建立/修改/删除对应节点的子节点 create /yyy/hello hello # 此时A服务器会收到事件NodeChildrenChanged WATCHER:: WatchedEvent state:SyncConnected type:NodeChildrenChanged path:/yyy
Java操做Zookeeper很简单,只须要添加ZooKeeper客户端的依赖便可,能够进行节点信息的获取、管理等。
步骤:
添加jar包
<!--ZooKeeper客户端--> <dependency> <groupId>org.apache.zookeeper</groupId> <artifactId>zookeeper</artifactId> <version>3.4.13</version> </dependency>
操做
public static void main(String[] args) throws IOException, KeeperException, InterruptedException { //获取ZooKeeper的链接,即建立ZooKeeper的客户端 String connectString = "127.0.0.1:2181"; //服务器地址 int sessionTimeout = 3000; //超时时间,单位为毫秒 Watcher watcher = new MyWatcher(); ZooKeeper zkClient = new ZooKeeper(connectString, sessionTimeout, watcher); Thread.sleep(2000); System.out.println(zkClient.getState()); /** * 操做ZooKeeper */ //查看指定节点下的内容 List<String> children = zkClient.getChildren("/", true);//第二个参数表示是否监视该节点 System.out.println(children); //建立节点,OPEN_ACL_UNSAFE表示acl权限列表为彻底开放,PERSISTENT表示节点类型为持久化节点 zkClient.create("/world", "世界".getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT); //获取节点的数据(节点的值和节点状态Stat) byte[] data = zkClient.getData("/world", true, null); System.out.println(new String(data)); Stat stat = new Stat(); byte[] data = zkClient.getData("/hello", true, stat); byte[] data = zkClient.getData("/hello", new DataWatcher(), stat); System.out.println(new String(data)); System.out.println(stat); System.out.println(stat.getCtime()); System.out.println(stat.getVersion()); System.out.println(stat.getDataLength()); //修改节点的数据 // zkClient.setData("/hello","aaa".getBytes(),stat.getVersion()); //第三个参数表示当前节点的数据版本,通常先获取数据stat,而后指定数据版本 zkClient.setData("/hello", "bbb".getBytes(), -1); //也能够设置为-1,表示不检测版本 //删除节点 zkClient.delete("/hello", -1); //判断节点是否存在 System.out.println(zkClient.exists("/hello",false)); //存在时返回节点状态,不存在则返回null //休眠 Thread.sleep(1000000); //关闭链接 zkClient.close(); }
ZooKeeper快速入门视频,连接:http://edu.51cto.com/course/16190.html