这是我参与8月更文挑战的第11天，活动详情查看：8月更文挑战git

📢欢迎点赞：👍 收藏 ⭐留言 📝 若有错误敬请指正，赐人玫瑰，手留余香！

📢本文做者：由webmote 原创，首发于【掘金】

📢做者格言：生活在于折腾，当你不折腾生活时，生活就开始折腾你，让咱们一块儿加油！💪💪💪

🎏 序言

以往在架构选项的时候，大概了解其作什么的，有什么优劣就够了，由于大部分互联网企业比较轻文档重快速迭代，每每并不会纠结过多的选型方案。github

只要方案合适，干就好了。web

遥忆刚工做那会，流行瀑布式开发模式，方案和需求的重要性放在最顶级的位置，每每方案须要写几十上百页，关键的技术选项还须要编写关键技术选项，通过好几轮的评审才可能最终走向需求、概要、详细和总结。固然评审里领导各类角度的问题，每每让人不知所措。算法

通过这些年的“放松”，编写技术文档的水平也愈来愈差了，甚至于不少中间件也只是了解个皮毛，深层次的原理都不肯意仔细看看，只关注怎么能利用这些中间件干点什么事上。markdown

这不，开始碰壁了，由于缺乏理论层面的指导，不少过去认为理所固然的事情，在须要仔细阐述并争取领导赞成上，就遇到了本身解释不清楚的各类问题。网络

怎么能快速说服领导上，遇到了很大的阻力。也让我看清楚了本身的问题之所在：缺少理论依据。固然做为大领导是否须要深刻的介入技术问题在这里不谈，由于人生惟一最大的事，莫过于修炼自身。架构

所以这篇文章送给我本身，修炼重在点滴间。并发

🎏 01.ETCD是干啥的?

etcd是一种高一致的分布式键值存储，它提供了一种可靠的方式来存储须要由分布式系统或机器集群访问的数据。它在网络内优雅地处理领导者选举，而且能够容忍机器故障，就算是领导者故障也不会影响高一致性。分布式

做为高一致性解决方案三剑客之一的ETCD（其余还有ZooKeeper、Consul），其最大的特色就是保持高一致性。高并发

🎏 02.一致性的概念

一致性是分布式系统提出的一个概念，由于对于单机系统，几乎不存在一致性的问题。

而为了解决单机存储的单点故障，就从架构上升级为了主备系统，备份系统使用各类方案对主系统上的数据进行备份，以便保持和主系统的数据同步。

而一旦开始复制数据，那么就产生了一致性的问题。

一致性的定义：对某个指定的客户端，读操做能保证返回最新的写操做的结果。

🎏 2.1 CAP定理

做为分布式系统中的最基础的定理，CAP是由加州大学的布鲁尔最早提出的一个猜测，最后被证实，而使之成为分布式计算领域公认的定理，所以也被称做布鲁尔定理。

CAP定理是说在一个分布式系统（互相连接并共享数据节点的集合）中，当涉及读写操做时，只能保证一致性（Consistency）、可用性（Avaliability）、分区容错性（Partition Tolerance)三者中的两个，另一个必须被牺牲。

可用性指非故障节点在合理的时间内返回合理的响应（不包含错误和超时）。分区容错：指当出现网络分区后，系统可以继续履行职责。换句话说，系统部分节点出现故障后，链接正常节点还可使用系统提供的服务。

不懂就搜，分区容错这个概念很差理解，所以这里引用知乎的回答。

一个分布式系统里面，节点组成的网络原本应该是连通的。然而可能由于一些故障，使得有些节点之间不连通了，整个网络就分红了几块区域。数据就散布在了这些不连通的区域中。这就叫分区。

当你一个数据项只在一个节点中保存，那么分区出现后，和这个节点不连通的部分就访问不到这个数据了。这时分区就是没法容忍的。

提升分区容忍性的办法就是一个数据项复制到多个节点上，那么出现分区以后，这一数据项就可能分布到各个区里。容忍性就提升了。

然而，要把数据复制到多个节点，就会带来一致性的问题，多个节点上面的数据多是不一致的。要保证一致，每次写操做就都要等待所有节点写成功，而这等待又会带来可用性的问题。

总的来讲就是，数据存在的节点越多，分区容忍性越高，但要复制更新的数据就越多，一致性就越难保证。为了保证一致性，更新全部节点数据所须要的时间就越长，可用性就会下降。

对于分布式系统，理论上不可能舍弃P，所以可选方案常常时CP或者AP架构，固然舍弃并非什么也不作，当发生分区时，能够作些事情，等到分区恢复后从新达到CA的状态。

🎏 2.2 一致性分类

一致性按照副本复制的策略又能够分为四种类型：

严格一致性：任何写入操做当即立刻同步给全部节点。而在分布式系统中，数据的同步都须要时间，所以可想而知，这种模型是没法作到的。
线性一致性：任何一次读都能读到某个数据的最近一次写的数据。系统中的全部进程，看到的操做顺序，都和全局时钟下的顺序一致。
顺序一致性：无论系统怎么运行，获得的结果就好像把全部节点的全部操做按照某个sequential order排序后运行，可是在这个sequential order顺序中，来自同一个节点的操做仍然保持着它们在节点中被指定的顺序。
最终一致性（弱一致性）

不保证在任意时刻任意节点上的同一份数据都是相同的，可是随着时间的迁移，不一样节点上的同一份数据老是在向趋同的方向变化。简单说，就是在一段时间后，节点间的数据会最终达到一致状态。

🎏 2.3 共识

共识（consensus）是分布式计算中最重要也是最基本的问题，它想要作的事情是：让全部节点就某事达成一致。共识问题中全部的节点要最终达成共识，因为最终目标是全部节点都要达成一致，因此根本不存在一致性强弱之分。

例如，Paxos是共识（Consensus）算法而不是强一致性（Consistency）协议。共识算法没有一致性级别的区分。

🎏2.4 两阶段提交

两阶段提交（two-phase commit） 是一种跨多节点实现原子提交的算法，即确保全部节点提交或全部节点停止。

ETCD中数据写同步也使用了两阶段提交，在leader收到写数据后变发起阶段1的写通知，若是超过半数的节点写了log，则发起第二阶段的正式写数据，并通知各个节点，若是半数写成功则提交数据，不然虽然不回滚数据，但后续能够覆盖之。

二阶段协议的关键，它经过两个阶段来把不可靠事务提交失败的概率下降到了最小，第一阶段通常占据了整个事务的大部分时间，而真正提交事务的第二阶段几乎是瞬间完成的，所以第二阶段出错的机率大大下降，因此这正是二阶段的巧妙之处。

现实中咱们不多使用二阶段提交协议来保证事务性，为何呢？

在现实场景中，最经常使用的是基于BASE理论的最终一致性
提交协议须要锁定资源，在性能上会有必定损失，这在高并发的场景中是不适合的。
提交协议引入了事务管理器（TM），致使系统实现比较复杂，复杂的事情通常不多有人愿意作。
分布式事务的最高境界是没有分布式事务！

🎏 03. ETCD的RAFT算法

归纳以下，详细的能够搜各种文章。

选择leader，每一个节点均可能时 leader、follower、candidate（候选人）三种角色，集群节点采用心跳检查各个节点的在线，若是发现leader跪了，则follower能够把本身提高为candidate，并广播全部节点，开始选举，超过半数赞成，就能够选做leader。

固然为了防止错误数据的节点被推选为leader，在选举中，必须带上本身保存的最新数据序列，以供其余节点比对。其余节点只有在检查发现你的数据正确或者更新的状况下才能够选举你为leader。

ooop，这里不存在拉票和做弊。

固然候选人也没有特别要求，若是条件都同样，则按照时间顺序的先来后到排队。

选出leader后，则每次写数据都是先写到leader，而后leader广播给全部节点，按照两阶段提交的方式写到整个集群。

🎏 04.通信协议

ETCD采用ProtoBuf编码，GRPC协议的方式读写数据，固然其也提供了更上层的http方式进行读写。 .net core 下有github下热心网友的封装类库，并没找到官方维护的sdk。

🎏 05. 小结

理论的学习仍是比较枯燥的，幸好有大家的陪伴，分享未尝不是一种快乐！

例行小结，理性看待！

结的是啥啊，结的是我想你点赞而不可得的寂寞。😳😳😳

👓都看到这了，还在意点个赞吗？

👓都点赞了，还在意一个收藏吗？

👓都收藏了，还在意一个评论吗？

理论修炼之ETCD，高一致性Key-Value服务提供者中的佼佼者