Zookeeper入门笔记(一)

#Zookeeper概述node

  • 背景
    • Zookeeper可让企业的IT架构逐步从集中式向分布式过分,所谓的分布式是指:把一个计算任务分解成若干个计算单元,而且分派到若干不一样的计算机中去执行,而后汇总计算结果的过程。
    • Zookeeper介绍
      • Zookeeper是源代码开放的分布式协调服务,由雅虎建立,是Google Chubby开源实现。Zookeeper是一个高性能的分布式数据一致性解决方案,它将那些复杂、容易出错的分布式一致性服务封装起来,构成一个搞笑可靠的原语集,并提供一系列简单易用的接口给用户使用。
  • Zookeeper的典型应用场景
    • 数据发布/订阅 顾名思义就是一方把数据发布出来,另外一方经过某种手动能够获得这些数据。
      • 一般数据订阅有两种方式:推模式和拉模式,推模式通常是服务器主动向客户端推送消息,拉模式是客户端主动去服务端获取数据(一般采用的是轮询的方式)。
      • Zookeeper采用两种方式的结合。
        • 发布者将数据发布到Zookeeper集群节点上,订阅者经过必定的方法告诉服务器,我对那个节点的数据感兴趣,那个服务器在这些节点的数据发送变化时,就通知客户端,客户端获得通知后能够去服务器获取数据信息。
        • 分布式协调/通知
          • 心跳检测:在分布式系统中,一般须要机器是否能够用,Zookeeper中咱们让全部的机器都注册一个临时节点,因此只须要判断这个节点是否存在就能够了,不须要直接去链接须要检查的机器,下降系统的负载度(节点分为临时和持久)。
    • Zookpeeper重量级使用
      • Hadoop、HBase、Storm、Solr。
  • Zookeeper的基本概览
    • 集群角色
      • Leader、Follower、Observer
        • Leader服务器是整个Zookeeper集群工做机制的核心
        • Follower服务器是Zookeeper集群状态的跟随者
        • Oserver服务器充当一个观察者的角色
        • Leader、Follower设计模式,Observer观察者模式
    • 会话
      • 会话是指客户端Zookeeper服务器的链接,Zookeeper中的会话叫Session,客户端与服务器创建TCP的长链接来维持一个Session,客户端在启动的时候首先会与服务器创建一个TCP链接,经过这个链接客户端可以经过心跳检测与服务器保持有效的会话,也能向Zookeeper服务器发送请求并得到响应。
    • 数据节点
      • Zookeeper中的节点有两类
        • 集群中的一台机器称为一个节点
        • 数据模型中的数据单元Znode,分别为持久节点和临时节点。(其实数据节点就是一个tree节点就是Znode)
    • 版本
      • Zookeeper中的版本
        • version
          • 当前数据节点数据内容版本
        • cversion
          • 当前数据节点子节点的版本号
        • aversion
          • 当前数据节点ACL变动版本号
    • watcher(事件监听器)
      • Zookeeper容许用户在指定节点上注册一些Watcher,当数据节点发生变化的时候,Zookeeper服务器会把这个变化通知发送给感兴趣的客户端。
    • ACL权限控制
      • ACL是Access Contril Lists 的缩写,Zookeeper采用ACL策略来进行权限控制,有如下权限:
        • CREATE:建立子节点
        • READ:获取子节点
        • WRITE:更新子节点数据权限
        • DELETE:删除子节点权限
        • ADMIN:设置节点ACL权限

#Zoopeeper环境搭建(集群、单机、伪集群)设计模式

  • 单机模式(设备环境有限暂时单机)
    • 准备工做
      • 下载Zookeeper(此处自行处理)
      • 解压 tar xzvf xxx.gz 解压
      • 重命名文件夹 Zookeeper 命令mv xxx xxx 后面的参数是新名字(能够不作)
      • 进入文件夹中/conf/
      • 复制配置文件zoo_sample.cfg(样例文件) 并重命名 zoo.cfg
    *   编辑zoo.cfg内容(仅供参考,具体环境自行修改)
    *   tickTime = 2000  
        *   tickTime:基本事件单元,以毫秒为单位。这个时间是做为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每一个 tickTime 时间就会发送一个心跳。  
    *   initLimit= 5  
        *   initLimit:这个配置项用来配置Zookeeper接受客户端初始化链接时最长能忍受多少个心跳时间间隔数,当已超过5个心跳的时间(也就是tickTime)长度后Zookeeper服务器尚未收到客户端的返回信息,那么代表这个客户端链接失败。总的时间长度是5 * 2000=4s。  
    *   dataDir = D:\\zookeeper\\data  
        *   顾名思义就是 Zookeeper 保存数据快照的目录,默认状况下,Zookeeper 将写数据的日志文件也保存在这个目录里)。  
    *   dataLogDir= D:\\zookeeper\\log
        *   顾名思义就是 Zookeeper 保存日志的目录。  
    *   synclimit = 5
        *   这个配置项表示Leader与Follower之间发送消息,请求和应答时间长长度,最长不能超过多少个tickTime的时间长度,总的时间长度是2 * 2000 = 4s。   
    *   clientPort = 2181  
        *   这个端口就是客户端链接 Zookeeper 服务器的端口,Zookeeper 会监听这个端口,接受客户端的访问请求。  
    *   Server(待续) 
        *   格式:server.id=host:port:port(两个port保证能够正常使用就行)
            *   id:一般为整数,而且不能重复使用整数。
            *   host:服务器的IP地址。
            *   port: Follower端口
            *   port: Leader选举投票。
        *   ZooKeeper建议使用hostname,而非ip。这须要对主机的/etc/hostname和/etc/hosts作host绑定(不一样的OS不一样修改方式)。
        *   建立一个myid文件(放在 dataDir文件下面)
        *   写入一行数据(请查阅zoo.cfg文件)
            *   写入id位置的数据便可。表示当前系统环境Zookeeper是哪个Server(通信用的)。   
    *   启动服务与中止服务
    *   进入bin/文件
    *   执行zkServer.cmd 或则 zkServer.sh
    *   CMD直接双击运行 ,SH则 sudo sh ./zkServer.sh start 启动 stop 关闭
    *   验证 使用telnet来测试(自行安装)
        *    telnet ip port 敲命令 stat 若返回数据表示当前服务器不能对外提供服务代表集群下其余服务器未启动(在Zookeeper中只要有半数的服务器正常工做就能够向外提供服务)。
    *   在此简单说明下何为伪集群就是在一台服务器上的多个Zookeeper的集群叫伪集群(伪集群 两个port不能与其余zookeeper的port同样)。
    *   单机模式就删除其余服务器运行的时候就是单机模式。
相关文章
相关标签/搜索