分布式系统中节点之间的同步造成区块链

时间 2019-12-13

标签分布式系统节点之间同步造成区块栏目系统架构繁體版

原文原文链接

链客，专为开发者而生，有问必答！算法

此文章来自链客区块链技术问答社区，未经容许拒绝转载。
服务器

分布式系统由Tanenbaum定义，“分布式系统是一组独立的计算机，在”分布式系统 — 原理和范例“中做为用户的单一，连贯的系统出现”。网络

区块链经过构建全球分布式系统，尝试实现分散的新数据存储和组织结构。并发

首先，定位到分布式系统的缘由主要是可扩展性，位置和可用性。区块链也不例外。地理可扩展性，造成全球价值存储网络/信息保护区域，包括非集中式结构下的防篡改/零停机时间的可用性。这些将来都是使用分布式系统在block中实现的。app

0.目录异步

X.区块链和分布式系统分布式

1.简介（同步和总体流程概述）性能

2.时钟同步区块链

2–1。物理时钟（时钟和时钟偏移）spa

2–2。时钟同步算法（网络时间协议（NTP）/伯克利算法）

3.逻辑时钟

3–1。 Lamport的逻辑时钟（彻底有序的多播）

3–2。矢量时钟（因果订单组播）

4.独家控制

4–1。集中算法

4–2。分散算法

4–3。分布式算法

5.选举算法

5–1。欺负算法

5–2。环算法

6.阻止链和同步做为分布式系统

6–1。块链和时钟同步（块链和物理/逻辑时钟）

6–2。块链和独占控制算法（PoW·PoS·BFT中的独占控制算法）

6–3。块链和领导者选举算法（PoW·PoS·BFT中的领导者选择算法）

1.简介（同步和总体流程概述）

与集中式系统不一样，在分布式系统中就时间达成一致并不容易。

在前一种状况下，能够基于全局共享时钟肯定绝对顺序关系，可是在后一种状况下，因为存在时钟值错误和对应时间，所以难以共享绝对时间。

可是，绝对时间的顺序并非绝对必要的，若是相对顺序是固定的，一般就足够了。咱们如何同步分布式系统中的全部时钟？此外，须要哪些算法才能在分布式系统中实现一致性同步？

在本文中，将按如下顺序解释节点之间的同步。

时钟同步是如何发生的？

使用逻辑时钟和矢量时钟的相对排序方法

关于分布式系统一致性的排除控制算法

关于分布式系统中的领导选举算法

2.时钟同步

2–1. 物理时钟

时钟和时钟歪斜

大多数计算机都有保持时间的电路，这种设备称为“时钟”。这是基于频率的振动，该振动能够经过晶体类型，切割方法和向精确加工的石英增长张力时的压力大小明肯定义。

虽然这个频率至关稳定，但不能保证不一样计算机的全部晶体都能以彻底相同的频率运行。由此引发的同步时间的差别称为时钟误差。

在这种状况下，特别是在实时系统中，如何使多个时钟与现实时钟同步以及如何同步时钟是一个问题。

现实世界中的时间最初基于平均太阳秒，但如今铯133过渡9,192,631,770次的时间定义为1秒，而且定义了国际原子时间和通用协调时间（UTC）。为了向须要准确时间的人提供UTC，使用WWV而且时间以±10毫秒的精度提供。

2–2. 时钟同步算法

可是，大多数机器没有WWV接收器。所以，每台机器都须要时间跟踪和管理算法，以便全部机器均可以同步时间。

顺便说起，用于肯定是否须要从新同步的错误，即时钟偏移，以下测量。

将H定义为每台机器计数的晶体振动引发的每秒中断次数（刻度数），并将C表示为该时钟的值。设Cp（t）表示机器的时钟值，当UTC时间为t时。

若是将p定义为定义容许的时钟误差量的最大漂移率，则假定它在如下范围内运行。

1-p <= dC/dt <= 1+p

也就是说，在从先前同步开始通过At秒以后，两个时钟最多分开2pΔt。

当保证在操做执行时没有大于＆的误差时，必须至少每＆/2p从新同步软件。

网络时间协议（NTP）

在许多协议中很常见，[Cristian，1989]首先提出的方法是一种与客户服务器通讯的方法。因为时间服务器具备WWV接收器或具备准确的时钟，所以它能够提供当前时间。在与服务器通讯时，重要的是延迟报告消息传播延迟的时间，可是经过估计延迟，这里能够最小化错误。目前，已知NTP可以在1至50毫秒的范围内实现精度。

伯克利算法

在诸如NTP的许多算法中，时间服务器是被动的而且仅回答查询。另外一方面，在Berkeley算法中，时间服务器接收每一个参与节点所持有的时间，而且还基于平均值改变其本身的时间。当时间值没必要与现实世界有关系时，很容易在同一当前时间达成一致，而且它对此算法有效。

3.逻辑时钟

到目前为止，虽然咱们描述了一种根据实际时钟将时钟与绝对时间同步做为参考的方法，但一般只执行相对同步。这里，逻辑时钟的概念用于肯定相对顺序。

3–1. Lamport的逻辑时钟

为了同步逻辑时钟，Lamport定义了一个名为happen-before的关系。表达式a→b表示“a发生在b以前”，这意味着事件首先发生，而后全部进程都赞成事件b将发生。发生以前 — 能够在如下两种状况下直接观察到关系。

若是a和b是同一过程当中的事件且a出如今b以前，则a→b为真。

若是a是由一个进程发送的消息的事件，而且b是由另外一个进程接收的该消息的事件，那么a→b也是如此。在发送消息以前没法接收消息，即便消息同时也须要有限的非零时间。

由于发生前关系处于过渡关系中，若是a→b和b→c，则能够证实a→c。若是事件x，y出如今不交换消息的不一样进程中，则x→y和y→x都不为真，而且这些事件被认为是并发的。（以前发生的关系未知。）

利用逻辑时钟，经过分配全部进程对每一个事件a一致的时间C（a）来测量相对时间。若是这些时间值是a→b，则经过向时间添加正值来校订它们，使得C（a）<C（b）。经过分配以下图所示的时间值，能够掌握以前发生的关系。

在Lamport的逻辑时钟中，若是a→b，则能够证实C（a）<C（b），但若是C（a）<C（b）则a→b不必定成立。换句话说，a→b是C（a）<C（b）的必要条件，而且不是充分条件。 Lamport的逻辑时钟增长了改进，它是一个矢量时钟，能够知足这种必要和充足的条件。

彻底有序的多播

有关详细信息，请参阅“分布式系统一致性”一文中的内容

在许多状况下，有必要在重复的副本之间执行彻底有序的多播。换句话说，全部消息都须要以相同的顺序传递给每一个收件人。 Lamport的逻辑时钟可用于在彻底分布式系统下实现彻底有序的多播。

当进程收到某个消息时，它会根据时间戳按顺序放入本地队列。收件人向另外一个进程多播确认。若是您按照Lamport的算法调整本地时钟，则全部进程实际上都具备本地队列的相同副本。只有当消息位于队列的头部而且被全部其余进程确认时，才有一个进程能够将队列中的消息传递给正在运行的应用程序，所以，全部消息都以相同的顺序传递到各处。换句话说，已经创建了彻底有序的多播。

3–2. 矢量时钟

使用矢量时钟，能够掌握Lamport逻辑时钟没法掌握的因果关系。假设事件a的向量时钟是VC（a），则执行如下步骤，使得a→b成为VC（a）<VC（b）的必要和充分条件。

在经过网络发送消息以前，节点Pi向矢量时钟VCi [i]添加1，或者操做一些内部事件。

若是处理Pi将消息m发送到Pj，则Pi在执行前一步骤以后将m的向量时间戳ts（m）设置为等于VCi。
当接收到消息m时，进程Pj执行步骤1，将消息分发给应用程序，而后更新其本身的向量时钟的每一个k，以下所示：VCj [k]←max {VCj [k]，ts（m）[k]}。

因果关系多播

经过使用向量时钟，能够实现稍微弱于上述彻底有序多播的因果有序多播。

经过比较矢量时钟的值并掌握发生在以前的关系，对于特定事件x，其余事件能够被分类为过去事件，并发事件和将来事件。例如，在上图中，当事件d用做参考点时，过去事件是a，b，c，i，并发事件是j，l，m，将来事件是f，g，h。

此时，假设因果有序多播是过去事件和因果事件的序列，其中发生全部因果关系，以便在全部过程当中保持一致，可是关于并发事件的顺序是可有可无的。经过这种方式，与Lamport的逻辑时钟不一样，能够用向量时钟来掌握因果关系。

4.独家控制

多个进程之间的并发操做和协做操做是分布式系统的基本，可是为了保证对资源的独占访问，以便经过多个进程同时访问相同资源时不处于不一致状态时，须要分布式排他算法。

分布式独占控制算法能够分为如下两种类型。

基于Token的解决方案

基于权限的方法

在基于Token的方案中，很容易避免Starvation（很长时间内不容许访问资源）和死锁（多个进程等待彼此的进展）。一个表明性的例子是Token环算法。可是，当持有Token的过程异常中止而且Token丢失，有必要只生成一个新Token，这种复杂性是一个严重的缺点。

许多其余分散的独占控制算法采用基于权限的方法，并有许多不一样的获取权限的方法，咱们将分别具体解释。

4–1. 集中算法

经过模拟单处理器系统的功能，能够轻松实现分布式系统中独占控制的单一访问。在集中式算法中，一个进程被指定为协调器，而且当进程访问共享资源时，请求消息被发送到协调器以得到许可。若是其余进程未访问共享资源，则协调器返回权限响应，而且在接收到回复以后，所请求的进程执行该进程。

很容易看出，该算法保证了对资源的独占访问，但它具备单点故障的严重缺点。虽然这多是大型系统中的性能瓶颈，但这种简单性带来的优点仍然能够弥补这些缺点。

4–2. 分散算法

假设各项都会重复n次。在分散算法中，当进程访问资源时，须要批准大多数m> n / 2。若是得到大多数批准，则该过程得到许可并能够进行处理。

虽然该方案解决了集中式算法的单点故障问题，可是若是有太多的节点试图访问，则存在另外一个问题，即没有节点能够得到足够的投票而没法得到充分的性能。

4–3. 分布式算法

在该算法中，假设系统上全部事件的顺序能够定义为彻底有序的关系。做为这个基础，使用了前一章中描述的Lamport的逻辑时钟，而且假设没有消息会丢失。

当进程尝试访问共享资源时，它会建立一条消息，其中包含资源名称，本身的进程号和当前逻辑时钟，并将其发送给全部其余进程。当接收到该请求消息时，根据其自身状态执行如下操做。

若是收件人未访问该资源且何尝试访问该资源，则收件人会向发件人返回“肯定”消息。
若是收件人已在访问资源，请不要回复并执行排队请求。
若是收件人正在尝试访问资源但还没有完成，请将输入消息中的时间戳与发送给其余进程的消息中的时间戳进行比较，并将较低的一个做为获胜者。若是收到的消息具备小的时间戳，则收件人返回OK消息。若是本身的消息具备较小的时间戳，则接收方将不会将输入消息排队。

显然，若是它不像process1或2那样冲突，这个算法就能正常工做。即便在冲突的状况下，也只创建了惟一一个进程能够访问的条件。

与集中式算法同样，该算法能够保证独占控制，不会出现死锁或饥饿。此外，没有单点故障。尽管如此，单点故障被故障n位置特征所取代。它能够经过回复权限或拒绝权限并引入超时来解决，但也会出现其余问题，例如须要多播通讯原语。不幸的是，目前还没有设计出超越集中式算法的分布式算法，而且仍在研究中。

当比较各个算法时，变为以下。

5.领导者选举算法

许多分布式算法须要一个特殊的过程，它具备领导者做为协调者或发起者的角色。哪一个过程是领导者，惟一过程是否能够成为领导者是一个重要问题，研究人员在过去几十年中一直在努力。

5–1. 欺负算法

当协调员失败而且任何进程P注意到该状况时，P根据如下过程激活选举。

· P向全部具备比其自身更高数值的进程发送ELECTION消息。

· 若是没有人回复，P将赢得选举并成为协调员。

· 若是来自具备高于P的数值的过程的答案，则将替换它。 P的工做结束了。

使用该算法，能够惟一地肯定协调器。可是，该算法须要大量的消息和数据流量，能够说是冗余的。做为替代方案，存在环算法。

5–2. 环算法

与通常环算法不一样，该算法不使用Token。发现协调器不工做的任何进程构造一个包含其本身的进程号的ELECTION消息，并将该消息发送给其后继者（环网中的下一个节点）。若是继任者失败，请跳过。若是没有比您更高的数值的节点，您的消息将仍然返回给您本身的进程号，所以它将被指定为协调员。

在该算法中，执行具备减小数量的消息的领导者选举，可是还能够经过将消息的目的地设置到两个相邻节点来实现具备较少许数据流量的算法。

6.阻止链和同步做为分布式系统

所以，在做为分布式系统之一的块链中，进程之间的同步如何发生？

6–1. 区块链和时钟同步

块链和逻辑时钟

首先，考虑是否可使用区块链中的物理时钟来掌握绝对时间关系。如第2章所述，参与网络的每一个节点并不老是保持正确的物理时钟，而且应该存在时钟误差。因为比特币区块链的平均生成时间是10分钟，所以认为即便必定程度的大时钟误差也是可接受的。然而，当节点散布在世界各地时难以同步各个物理时钟，而且还可能存在假装时钟的节点。经过引入网络时间协议（NTP）来从新同步节点之间的正确时间是一项困难的技术。

区块链和逻辑时钟

所以，准备逻辑时钟而不是物理时钟是切合实际的。实际上，经过在块中加入时间标记，能够制备出与Lamport逻辑时钟很是类似的机制。

如[比特币：点对点电子现金系统Satoshi Nakamoto]中所述，对做为矿工的区块执行写操做的每一个节点自己具备做为时间戳服务器的角色。每一个时间戳经过在其哈希中包含前一个时间戳来造成链。可是，没法保证这些节点保持正确的物理时钟。时间戳的数值，即每一个事务的顺序和时间相对模糊。

因为时钟的这种模糊性，有可能会进行双重付款。可是，在比特币区块链中，只有最长的链是合法的，在次要验证后丢弃不正确的交易。所以，区块的顺序随着时间的流逝惟一肯定。随着每一个时间戳的增长，前一个时间戳被增强。

总之，在区块链中的模糊时间戳下，事务的顺序一致性是不许确的。然而，利用链式链接的简单机制，每一个交易的发生前关系随着时间的推移而创建。此外，还有一种激励结构，以便矿工转移到良好，交易不一致的顺序不会发生。

能够说，实现相似于Lamport的逻辑时钟的时钟同步方法，由于事务之间的相对顺序关系，即发生在以前的关系变得更清楚。

对于大多数交易，没有因果关系，所以若是您引入向量时钟并采用因果关系排序的概念，则能够极大地放松订单关系的约束。然而，在区块链中，因为结构自己默认共享全部块的顺序关系，因此保持总排序（相对于在一段时间以后的块）。

6–2. 区块链和独占控制算法

即便在做为分布式系统的区块链中，也须要排除控制。在区块链网络中，每一个节点并行地异步操做。此时，要共享的区块链自己的信息不该该不一致。

PoW·PoS中的独占控制算法

如第4章所述，分布式排他控制算法可分为如下两种类型。

· 基于Token的解决方案

· 基于权限的解决方案

PoW和PoS是基于权限的，其中，能够说它是相似于分布式算法的机制。那么，您何时得到访问资源的权限？是的，就在你找到一个随机数时。

在PoW中，只有当找到在哈希值后跟0后跟n为0的随机数时，才能够执行有效的新块写操做。执行操做的矿工将其广播给全部矿工并分享。

一般，当节点找到一个nonce并建立一个比他本身更早的块时，minor会同步该信息并移动以搜索下一个nonce值。这是由于若是您使用最长链被认为合法的规则搜索下一个nonce值，它们能够得到更多利润。尽管PoS优先为具备较大硬币持有量的人提供资源访问，但基本排除控制算法结构也相似于分布式算法。

可是，严格来讲，不执行排除控制。这是为了在公共时间内同步并造成共识10分钟，直到下一个区块为止。当两个或更多个节点同时找到随机数值时，写入操做以非独占状态执行。此时，因为只有最长的链被认为是合法的，所以区块链网络中的信息与时间的流逝保持一致。叉子发生的一个问题是由于没有执行严格的排他控制并且没有确认最终结果。

BFT类型的独占控制算法

另外一方面，经过BFT类型，基于许可的分散算法执行排他控制。该算法解决了分叉和终结问题，这是PoW中与分布式算法相似的问题。

在BFT类型中，只有一个名为Proposer，Orderer等的节点有权生成新区块。建立区块时，您能够从全部参与节点收集投票，得到超过2/3的赞成，您才有权建立新块。此时，有必要赞成超过2/3而不是多数的缘由是处理拜占庭故障，有关此问题的详细信息在“分布式系统中的容错”一文中有所描述。

在BFT类型算法中，与PoW等不一样，只有一个节点能够得到对区块链的独占访问权限，所以不会当即肯定fork和finality。可是，任何人均可以做为矿工参与网络的财产每每会丢失。

6–3. 区块链和领导者选择算法

PoW，PoS和领导者选择算法

区块链上的领导者选择算法相似于独占控制算法的机制。在比特币中，用于选举领导者的算法，即，新建立块的节点是PoW。

PoW容许添加一个块做为一个好的领导者，为比特币网络提供有计算复杂性和发现nonce的节点。每一个成为领导者的矿工都会尝试为比特币网络作出贡献，由于更容易早期同步到首先发现现时的节点并开始搜索下一个块的现时值更有可能得到奖励。尽管存在链条彻底由硬叉分支的问题，可是经过基于博弈论准备很是简单的激励结构，在块链网络中实现做为分布式系统的同步。

在以太坊的状况下，因为块生成的时间很短，所以倾向于发生更多的分叉。关于这一点，经过采用unkle块的概念，咱们实现了一种结构，即便产生不合法的链条也会给予必定的奖励。

未来引入将来的PoS容许优先生成具备大硬币保持量的节点的块做为引导者。这是一种解决/改善PoW中必要电量变得巨大且易受51％攻击的问题的算法。这是一种基于博弈论的选举算法，若是一个节点持有大量硬币，就不会采起破坏网络等恶意行为。

BFT和领导者选择算法

BFT类型算法的问题在于如何选择将投票给块生成的领导者做为Proposer或Orderer。

在PBFT采起的HyperLedger当中，原为可信赖的机构才会注册为Orderer。但这是集中式的领导者选择方法，与分布式系统存在着明显的区别。

在Tendermint协议当中，领导者以循环方式被选出，以经过与不一样验证者的轮换交替来提出建议。此时，领导候选者是基于PoS，而且能够说是能够在分布式系统中实现领导者选择的算法之一。