ZooKeeper 是一个分布式的,开放源码的分布式应用程序协同服务。ZooKeeper 的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来,构成一个高效可靠的原语集,并以一系列简单易用的接口提供给用户使用。html
ZooKeeper 最先起源于雅虎研究院的一个研究小组。在当时,研究人员发现,在雅虎内部不少大型系统基本都须要依赖一个相似的系统来进行分布式协同,可是这些系统每每都存在分布式单点问题。java
因此,雅虎的开发人员就开发了一个通用的无单点问题的分布式协调框架,这就是 ZooKeeper。ZooKeeper 以后在开源界被大量使用,下面列出了 3 个著名开源项目是如何使用 ZooKeeper:node
不少分布式协调服务均可以用 ZooKeeper 来作,其中典型应用场景以下:数据库
ZooKeeper 适用于存储和协同相关的关键数据,不适合用于大数据量存储。若是要存 KV 或者大量的业务数据,仍是要用数据库或者其余 NoSql 来作。apache
为何 ZooKeeper 不适合大数据量存储呢?主要有如下两个缘由:vim
要使用 ZooKeeper 服务,首先咱们的应用要引入 ZooKeeper 的客户端库,而后咱们客户端库和 ZooKeeper 集群来进行网络通讯来使用 ZooKeeper 的服务,本质上是 Client-Server 的架构,咱们的应用做为一个客户端来调用 ZooKeeper Server 端的服务。服务器
ZooKeeper 的数据模型是层次模型。层次模型常见于文件系统。层次模型和 key-value 模型是两种主流的数据模型。ZooKeeper 使用文件系统模型主要基于如下两点考虑:网络
ZooKeeper 的层次模型称做 data tree。Data tree 的每一个节点叫作 znode。不一样于文件系统,每一个节点均可以保存数据。每一个节点都有一个版本(version),版本从 0 开始计数。session
如上图所示的 data tree 中有两个子树,一个用于应用 1(/app1)和另外一个用于应用 2(/app2)。架构
应用 1 的子树实现了一个简单的组成员协议:每一个客户端进程 pi 建立一个 znode p_i 在 /app1 下,只要 /app1/p_i 存在就表明进程 pi 在正常运行。
ZooKeeper 对外提供一个用来访问 data tree的简化文件系统 API:
一个 znode 能够是持久性的,也能够是临时性的,znode 节点也能够是顺序性的。每个顺序性的 znode 关联一个惟一的单调递增整数,所以 ZooKeeper 主要有如下 4 种 znode:
到 https://archive.apache.org/dist/zookeeper/stable/ 下载 ZooKeeper,目前的最新版是 3.5.6。
把 apache-zookeeper-3.5.6-bin.tar.gz 解压到一个本地目录 (目录名最好不要包含空格和中文)。我使用 /usr/local 目录。
tar -zxvf apache-zookeeper-3.5.6-bin.tar.gz
把 conf 目录下的 zoo_sample.cfg 重命名为 zoo.cfg,而后修改配置。
# 心跳检查的时间 2秒 tickTime=2000 # 初始化时 链接到服务器端的间隔次数,总时间10*2=20秒 initLimit=10 # ZK Leader 和follower 之间通信的次数,总时间5*2=10秒 syncLimit=5 # 存储内存中数据快照的位置,若是不设置参数,更新事务日志将被存储到默认位置。 dataDir=/data/zookeeper # ZK 服务器端的监听端口 clientPort=2181
配置如下环境变量 vim /etc/profile
:
export ZOOKEEPER_HOME=/usr/local/apache-zookeeper-3.5.6-bin export PATH=$PATH:$ZOOKEEPER_HOME/bin:$ZOOKEEPER_HOME/conf
再安装配置完成后,就能够启动 Zookeeper,使用 zkServer.sh start 启动 ZooKeeper 服务:
[root@wupx apache-zookeeper-3.5.6-bin]# zkServer.sh start /usr/bin/java ZooKeeper JMX enabled by default Using config: /usr/local/apache-zookeeper-3.5.6-bin/bin/../conf/zoo.cfg Starting zookeeper ... STARTED
检查 ZooKeeper 日志是否有出错信息:
[root@wupx apache-zookeeper-3.5.6-bin]# cd logs/ [root@wupx logs]# grep -E -i "((exception)|(error))" *
由于返回没有结果,说明没有错误信息。
检查 ZooKeeper 数据文件,这里存放的 ZooKeeper 的事务日志文件和快照日志文件。
[root@wupx zookeeper]# cd /data/zookeeper/ [root@wupx zookeeper]# tree . ├── version-2 │ └── snapshot.0 └── zookeeper_server.pid 1 directory, 2 files
由于如今尚未运行任何 ZooKeeper 命令,因此尚未事务日志文件。
最后会检查 ZooKeeper 是否在 2181 端口上监听。
netstat -an | ag 2181
执行后,咱们能够看到 ZooKeeper 已经在 2181 这个端口上监听了。
下面咱们演示下如何使用 zkCli:
在执行 zkCli.sh
命令后,会出现不少消息,这些消息证实咱们的 zkCli 和 ZooKeeper 的节点创建了有效链接。
2019-12-22 10:38:36,684 [myid:localhost:2181] - INFO [main-SendThread(localhost:2181):ClientCnxn$SendThread@959] - Socket connection established, initiating session, client: /127.0.0.1:54038, server: localhost/127.0.0.1:2181
使用 ls -R /
能够递归查找 ZooKeeper 的 znode 节点,使用 create /znode_name
能够建立 znode 节点,具体演示以下:
# 使用 ls -R 能够递归查找 ZooKeeper 的 znode 节点 [zk: localhost:2181(CONNECTED) 0] ls -R / / /zookeeper /zookeeper/config /zookeeper/quota # 建立 znode /app1 [zk: localhost:2181(CONNECTED) 1] create /app1 Created /app1 [zk: localhost:2181(CONNECTED) 2] create /app2 Created /app2 [zk: localhost:2181(CONNECTED) 3] create /app1/p_1 1 Created /app1/p_1 [zk: localhost:2181(CONNECTED) 4] create /app1/p_2 2 Created /app1/p_2 [zk: localhost:2181(CONNECTED) 5] create /app1/p_3 3 Created /app1/p_3 [zk: localhost:2181(CONNECTED) 6] ls -R / / /app1 /app2 /zookeeper /app1/p_1 /app1/p_2 /app1/p_3 /zookeeper/config /zookeeper/quota
分布式锁要求若是锁的持有者宕了,锁能够被释放。ZooKeeper 的 ephemeral 节点刚好具有这样的特性。
接下来咱们来演示下,须要在两个终端上分别启动 zkCli,
在终端 1 上:
执行 zkCli.sh
,再执行 create -e /lock
命令,来创建临时 znode,加锁的操做其实就是创建 znode 的过程,此时第一个客户端加锁成功。
接下来尝试在第二个客户端加锁,在终端 2 上:
执行 zkCli.sh
,再执行 create -e /lock
命令,会发现提示 Node already exists: /lock
,提示 znode 已存在,znode 创建失败,所以加锁失败,这时候咱们来监控这个 znode,使用 stat -w /lock
来等待锁被释放。
这个时候咱们退出第一个客户端,在终端 1 上执行 quit
命令,会在客户端 2 上收到一条 WATCHER 信息,具体以下:
WATCHER:: WatchedEvent state:SyncConnected type:NodeDeleted path:/lock
再收到这个事件后再次在客户端 2 上执行加锁,执行 create -e /lock
,会显示建立 znode 成功,即加锁成功。
这篇文章主要介绍了 ZooKeeper 的安装配置,ZooKeeper 的基本概念和 zkCli 的使用,并用 zkCli 来实现一个锁,为后面更加深刻的学习打好基础。
参考
https://zookeeper.apache.org/doc/current/zookeeperOver.html
https://zookeeper.apache.org/doc/current/zookeeperStarted.html
《从Paxos到Zookeeper:分布式一致性原理与实践》