ZooKeeper持久化原理

时间 2019-12-21

标签 zookeeper 持久原理栏目 Zookeeper 繁體版

原文原文链接

ZK 的数据与存储中，有几个特别关注点：缓存

内存数据与磁盘数据间的关系：
- 内存数据，是真正提供服务的数据
- 磁盘数据，做用：
  - 恢复内存数据，恢复现场
  - 数据同步：集群内，不一样节点间的数据同步（另，内存中的提议缓存队列 proposals）
  - 磁盘数据，为何同时包含：快照、事务日志？出于数据粒度的考虑
    - 若是只包含快照，那恢复现场的时候，会有数据丢失，
      - 由于生成快照的时间间隔太大，即，快照的粒度太粗了
    - 事务日志，针对每条提交的事务都会 flush 到磁盘，
      - 所以粒度很细，恢复现场时，可以恢复到事务粒度上
快照生成的时机：基于阈值，引入随机因素
- 解决的关键问题：避免全部节点同时 dump snapshot，
  - 由于 dump snapshot 耗费大量的磁盘 IO、CPU，
  - 全部节点同时 dump 会严重影响集群的对外服务能力
- countLog > snapCount/2 + randRoll，其中：
  - countLog 为累计执行事务个数
  - snapCount 为配置的阈值
  - randRoll 为随机因素（取值：0～snapCount/2）
ZK 的快照文件是 Fuzzy 快照，不是精确到某一时刻的快照，而是某一时间段内的快照
- ZK 使用「异步线程」生成快照：
  - 线程之间共享内存空间，致使 Fuzzy 快照
  - 这就要求 ZK 的全部事务操做是幂等的，不然产生数据不一致的问题
  - 实际上 ZK 的全部操做都是幂等的
- 类比：Redis 中使用「异步进程」生成快照 RDB（Redis Dump Binary）
  - RDB 文件是精确的快照，缘由：进程之间内存空间隔离
  - 系统内核使用「写时复制」（Copy-On-Write）技术，节省大量内存空间

https://blog.csdn.net/varyall/article/details/79564418异步

若在Zookeeper进行快照的过程当中,接收了客户端的请求,此时会将该请求应用到DataTree吗?
- 若会,这会出现什么问题?如何解决?
  - Zookeeper是调用zks.takeSnapshot()生成快照文件的,
  - 这个方法及其底层的方法并无对DataTree加锁,
  - 所以生成快照文件并非一个原子性的操做,
  - 因此快照执行开始到快照执行结束期间发生的事务也会应用到DataTree中,
  - 也会持久化到快照文件中,也即说明即便快照后缀名为n,此快照文件也有可能包含n+1,n+2这些事务的执行结果.

https://blog.csdn.net/jpf254/article/details/80769525.net