Paxos的工程实践

时间 2019-12-01

标签 paxos 工程实践栏目 Zookeeper 繁體版

原文原文链接

Chubby 大名鼎鼎的分布式锁算法

Chubby 是一个面向松耦合分布式系统的锁服务数据库

分布式锁服务具备4个传统算法库所不具备的优势：缓存

对上层应用程序侵入性更小
- 在系统用户达到必定规模前，高可用性并未被足够重视，
- 达到必定规模后，开始重视，集群等措施加上去，一致性变得相当重要
- 分布式锁服务比封装一致性协议的客户端库侵入性小
便于提供数据的发布与订阅
- 分布式锁很是适合提供该功能，两者实现上是相通的
开发人员对基于锁的接口更为熟悉
- Chubby 提供了一套近乎和单机锁机制一致的分布式锁服务
- 远比一致性协议库来的更加友好
更便捷的构建更可靠的服务
- 分布式一致性算法，都要用Quorum机制来进行数据项值得选定
- Quorum机制：指在一个集群中，一个数据项值得选定须要集群中过半数机器赞成，只要集群中3台机器存在，就能提供正常的服务；
- 而分布式一致性协议，只能交给开发人员本身处理，增长了开发成本

Chubby 设计目标：服务器

提供一个完整的、独立的分布式锁服务，而非一致性协议的客户库
提供粗粒度的锁服务
- Chubby 提供的是长时间持有的锁
提供锁服务的同时，提供小文件的读写功能
- 提供小文件的读写功能，可使得被选举出来的Master ，在不依赖额外服务的状况下，很是方便的向全部客户端发布本身的状态信息。
高可用高可靠
- 只要三台以上就能提供正常服务
- 支持小文件读写服务，进行Master 选举结果的发布订阅
提供事件通知机制
- 服务端数据变化，以事件通知的方式实时通知订阅的客户端

Chubby 技术架构session

Chubby 集群称为 Chubby cell 一般由5台服务器组成。
副本服务器经过Paxos 协议，投票产生Master（票数过半）
一旦一台服务器称为Master，Chubby保证一段时间不会再有其余服务器成为Master（这段时间叫作“Master租期”）
Master 服务器会不断延长租期的形式续租，一旦故障，从新选举
每台服务器都保存服务器数据库副本，只有Master 能写，其余与之保持同步
客户端如何定位Master
- 首先向记录有服务端机器列表的DNS获取全部Chubby 服务
- 挨个询问是不是Master，非Master 会把Master 返回给客户端
一旦定位到Master ，写请求会广播给全部服务器，过半接受了该请求就响应客户端，读请求Master 独立处理
若是Master 崩溃了
- 其余服务器会在Master租期到期后，进入新一轮的选举（选举几秒钟结束）
若是非Master 崩溃
- 不影响，本身重启便可
- 长时间不能恢复，须要加入新的机器，配置DNS，Master是周期扫描DNS的，会很快感知到，其余服务器复制Master方式很快知道

目录与文件：数据结构

Chubby 的数据结构是目录与文件组成的树
ls是全部的前缀（根目录 lock service）
foo 是Chubby 集群的名字
每一个节点分为持久节点和临时节点
- 持久节点须要显式的调用接口API进行删除
- 临时节点和客户链接session 绑定，会话失效后，自动删除
  - 因此临时节点能够做为客户端有效性的判断依据
每一个节点都包含少许元数据信息
- 包括权限控制的访问控制列表（ACL）
- 每一个元数据还包括4个单调递增64位编号，分别是：
  - 实例编号：标示建立该实例节点的顺序（即使名字相同，也能区别俩节点）
  - 文件内容编号（只针对文件）：用于标示文件内容变化，文件内容被写入时增长
  - 锁编号：锁状态变动状况，节点锁在自由转到被持有时增长
  - ACL编号：ACL被写入时增长
  - 以外，还会提供64编号标识文件内容校验

Chubby 中的事件通知机制架构

Chubby 中的缓存并发

在客户端实现了缓存
会在客户端对文件内容和元数据进行缓存
- 租期机制保证缓存的一致性
- 缓存机制和Master的租期密切相关，Master维护客户端缓存，
- 向客户端发送过时信息，保证客户端要么访问一致性数据、要么访问不到数据
  - 若是数据修改，Master先阻塞该操做，先向全部可能缓存的客户端发送过时信息，收到全部相关客户端的应答，再修改

会话和会话激活（KeepAlive）异步

会话超时分布式

Chubby Master 故障恢复

Poxos 协议实现

Hypertable

主要包括四个部分：