探究以太坊 2.0 的分叉选择规则

时间 2019-12-07

标签探究以太 2.0 分叉选择规则繁體版

原文原文链接

编者注：文章原题为“html

Detailed overview of Ethereum 2.0 shard chains: Committees, Proposers and Attesters
（关于以太坊 2.0 分片链细节概述：委员会、提案者和证实者）”。读完这篇文章就更能理解：为何权益证实没法使用最长链规则而必须采用其余规则，而这些规则又会有怎样的局限性。文章很是长，但不读你就错过了。有兴趣的读者能够结合文末超连接研究一下。

时至今日，许多关于以太坊 2.0 的工做细节已经公诸于众，同时还有许多团队在着手实现。可是以太坊 2.0 还有一大块空白的部分还未规范，也没有披露什么讯息，那就是分片链技术。基本上全部关于规范的部分都展现在这里，而这篇博客会着重提供一些细节概述。git

脚注：这篇文章的第一版所述的方法，称做即时消息驱动（IMF, immediate message driven），如今已经被抛弃了。相关内容能够在这里找到。github

委员会及其构造

只要将 32 个 ETH 放入现有主链（PoW chain）上指定的智能合约，任何以太坊网络中的参与者都能成为验证者节点。算法

-Image by Hsiao-Wei Wang-安全

参与者进入验证者池以后，就能够被分配给某个分片。分配过程是是彻底随机的，能够经过可验证延时函数（VDFs，Verifiable Delay Functions）保证随机的无偏性。bash

若是有参与者质押的权益超过 32 ETH（假设是 320 ETH），他们就会得到相应比例的验证者席次。这些席次彼此之间无关，会被独立地分配给分片网络；因此对于投入 320 ETH 的参与者来讲，最不理想的状况是在单个出块时段，成为十个不一样分片网络的验证者。但若是不这么设计的话，就会增长竞争敌手接管某一个分片的可能性；通常来讲，咱们都预期那些拥有更多权益的人能够调用更多的资源以及算力（所以要防范这一点）。网络

在 proof-of-stake 系统中产出区块

以太坊 2.0 是 PoS 系统。在本章节，咱们先回顾一下现有的且被推崇的 PoS 区块链中，是如何产生区块的：架构

在这样的框架中，生成区块的时间间隔是固定的。例如每五秒生成一个区块，并由一群验证者来进行建立和验证区块。在每五秒的出块时段内，会有一个验证者被指定来生产该时段（time slot）的区块。若是验证者彼此之间的权益数量不一样，则有较多权益的验证者会有较高的几率成为区块生产者。框架

当分叉发生时，诚实的验证者会选择具备最多区块的那条链。只要诚实的验证者占所有验证者总数的一半以上，想要伪造一条最长链是很是困难的。假设全部少数恶意节点试图联合起来，私下建立一条分叉链，而且故意在诚实链的出块时段内不产出区块；即便如此，他们的恶意分叉仍然会比诚实链要来的短；这个论点相似 PoW 系统，只要超过一半以上的算力由诚实节点控制，要反转最长链的可能性极低。函数

然而若是直接实施这种架构，会存在许多问题。首先，短程分叉仍是颇有可能发生；只要少数节点控制了所有验证者中的 10% ，最后的几个区块，好比说六个，的回滚几率仍是高的使人没法接受；第二，会出现各式各样的审查问题。举例来讲，若是恶意节点碰巧在一条队列中得到连续两个出块时段的出块权力，他们就能审查前一个出块时段产生的区块：

上图中恶意验证者控制了第 3 和第 4 个出块时段；它们可以紧接在 1 号块（即第 1 个出块时段所出的块）以后生成区块，实质上形成对 2 号块的审查。而诚实的验证者在第 5 个出块时段生产区块时，会选择被操控的包含第 3 和第 4 区块的链，由于它们是较长链。

即使是单个恶意验证者也能试着去审查前一个时段的区块。以下图所示，X 轴表示时间轴，出块时段标记在底部，区块中的数字表示人们预期的该块的出块时段（标号1 即表示人们预期这个块会在第 1 个出块时段出块）。假设诚实的验证者被指派为第 0 和 2 时段生产区块；该诚实验证者将区块 0 广播出去以后，被指派为第 1 个时段出块的恶意验证者能够扣住区块不去广播，等到区块 2 被广播出去后再广播区块 1（因为负责出区块 2 的验证者没有收到区块 1 ，他们会紧接着区块 0 构建他们的区块；所以，区块 1 和区块 2 就变成了两条一样长的分叉链）。

等到第 3 个出块时段，诚实的验证者应该接着哪一个块建立新的区块呢？咱们考虑如下四种可能的状况：

老是跟在较早建立的区块后面。这么一来，处在较早出块时段的恶意验证者就会延迟广播区块，直到下一个出块时段的区块被建立后再广播，致使后者就被忽略（如上图情景所述）。
老是跟在较晚建立的区块后面建块。这种状况下，在时段 X 出块的恶意验证者能够选择无视时段 X-1 建立的区块，而且能确保负责时段 X+1 的验证者必定会选择他的区块，而时段 X-1 建立的块就会被忽略。
老是跟在本身先接收到的区块后面建块。这种状况下，只要恶意验证者比下一个验证者的网速更快更稳，上述两种情形都有可能发生。
随机选择区块。这样恶意验证者就没法肯定本身建立的区块会不会被接受（除非它们在一条网络中控制了多个出块时段）；可是若是审查区块能得到高于出块的奖励，恶意验证者仍会尝试做恶，同时有 50% 的成功概率。

上面的四种状况都是咱们不肯意见到的。

拜占庭方法

针对上述问题，人们提出了一系列的提案，这些提案的想法是在验证者建立区块时，使用一种拜占庭共识算法。最先设想这个方法的论文是 ByzCoin ，然后又有许多基于它的协议被提出。它们的核心思想是：一旦区块通过委员会最终肯定，只要恶意节点数量不超过 1/3，这个区块就是不可逆的，换句话说分叉和篡改没法成功。

这个方法有两个主要的缺点， a) 大多数拜占庭算法很慢，没法应对大量参与者要达成共识的场景； b) 掉线的节点会被视为恶意行为，由于若是少于 2/3 节点在线，区块共识就没法达成，进而致使系统总会在某些时候停滞不前。

查看证实（Attestations）数量的方案

以太坊 2.0 延续使用以前的方法，也就是在每一个出块时段，会有一个验证者（又称做提案者，proposer）被指派产生区块。并且以太坊 2.0 还进行了拓展：委员会的其余验证者被激励去“证明（attest）”这个区块，也就是给它签名。这种签名使用了 BLS 群签名方法，能够避免随着签名增长而使得区块大小暴增。并且对于给定的出块时段，若是验证者没有看到新建立的区块，或是区块不在当前应该在的链上，验证者被鼓励去证实存在这个状况，又称做证实“跳过该区块”的操做。这样一来，诚实的验证者会证实每一个出块时段都正好有一个区块产生；这多是由提案者建立的真实区块，或是一个被跳过的区块（“跳过该区块”）。

借由证实者机制和分叉选择规则，以太坊 2.0 分片链避免了通常 PoS 方法和拜占庭共识算法的问题。

分叉选择规则

即时消息驱动（IMD）

从创世区块开始，每当咱们面临分叉时，只要某个分支上具备的验证者（即为该分支的当前和以往区块作证明的验证者）比其它分支都要更多样，咱们就认为它是应该被选择的分支（预告，后面会提到最新消息驱动 Latest Message Driven）。

咱们分析一下上图所示的情形。每一个区块中的字母表示该区块得到的证实，虚线的区块表示“跳过该区块”操做。如今发生分叉，Alice (A)、Bob (B)、Carol (C)、Dave (D) 和 Elaine (E) 已经证实过下分支的部分区块；而 Victor (V)、Xavier (X)、Yasmine (Y) 和 Zach (Z) 证实过上分支的区块。为了找出正确的那条链，咱们得从创世区块开始往右推演。参与者必须在第 2 个出块时段对上下两条分支进行选择；而分叉选择规则告诉咱们，要选择在其上有较多不重复的证实者的分支。咱们能够看到，下分支有五个证实者（Alice, Bob, Carol, Dave and Elaine），上分支只有四个（Victor, Xavier, Yasmine and Zach），因此咱们选择下分支。注意，其实在下分支里，并无某个块是获得五个验证者证实的，甚至连获得四个证实的块都没有（在第 7 个出块时段以前的链，只有来自 Alice, Bob 和 Carol 的证实；若是链在第 8 个出块时段结束的话，也只有来自 Alice, Dave 和 Elaine 的证实）。可是下分支的累计证实数比上分支多，所以选择前者做为链。

类似的，在第 6 个出块时段也要进行一次分叉选择；上面分支有三个证实者（ Alice, Bob 和 Carol ），下面的只有两个（ Dave 和 Elaine ），因此最终结果会选择包含出块时段 1 、二、四、六、7 所创块的链。

最新消息驱动 Latest Message Driven

在（最新消息驱动）这种分叉选择规则中，（在确认哪条分支有多少验证者时）咱们只考虑这些验证者在最新的出块时段提交的证实。举例来讲，在下图中的第 3 个出块时段（也就是最新的出块时段）， Alice 提交了对上分支区块的证实，所以咱们认定 TA 选择了上分支。换言之，Alice 在第 2 个出块时段的证实将被忽略掉，所以咱们在第 0 个出块时段进行分叉选择的时候，上分支有三个证实者（ Alice, Bob 和 Elaine ），下分支只有两个（ Carol 和 Dave），咱们选择上面的分支：

要注意的是，此种分叉选择规则只看 Alice 在最新的出块时段（出块时段 3）的选择，这和 Alice 最早提交哪一个证实或是特定观察者最早接收到哪一个证实无关。

证实的条件

只有在区块知足某些条件时，诚实的证实者才会对区块进行证实：

区块属于证实者认定的当前被选择的链上；
证实者在同一个出块时段内，没有对其余区块进行过证实。

注意：咱们相信诚实的提案者不会在同一个出块时段内建立两个区块；所以，这种分叉选择规则只要配合罚没规则即可使用：当出现恶意提案者试图在同个出块时段建立多个块，以此分叉区块链的时候，它的权益会被当即罚没掉。

若是证实者没有收到特定出块时段的区块，则证实者会采起证实“跳过该区块”的操做。由证实者自行选择等待时间，直到他们决定中止等待并证实“跳过该区块”操做。Danny Ryan 建议诚实的证实者应该等到出块时段过了一半以后，再进行最终他们认为正确的证实（不管是对实际区块或是跳过的区块进行证实）——由于大多数证实者都会这么作。

分析

活跃性

不一样于其余拜占庭共识算法，在上述方法中，即便超过 1/3 占比的节点掉线，出块过程也能继续正常运行。网络中的参与者会仔细检查只获得少于 2/3 证实的区块，并对这些区块更加当心，直到有其余附加的安全条件被知足（好比，等到这些区块被交叉关联（cross-link）到信标链（The Beacon Chain），而且由 Casper FFG 进行过确认……这些就超出本文讨论范围了）。不过最重要的是，系统会持续出块，而不会延宕。

抗审查性

回顾一下上面提到的两种审查场景，在第一种情形中，拥有连续两个时段出块权的验证者想审查前一个区块就不可能成功了，由于分叉选择与链长度再也不有任何关系。

若是没有限制验证者只能在相应的出块时段内作证实，那么第二种场景（提案者延迟出块，直到下个出块时段的区块被建立出来）仍然可能发生：出块时段 X 中的恶意验证者能够延到 X+1 块被建立后，再广播他们的区块。对于证实者来讲，他们没法区分恶意攻击或仅仅是网络延时的区别，并且一旦证实没有限定的时间窗口，人们就能够在后来证明 X，有效地审查 X+1。

要求在特定时间窗口进行证实能够解决上述问题，只要全部参与者的时钟都是同步的。若是没法保持同步（但仍然在数秒钟的时间范围内），基于时间差的攻击就有可能发生；固然发生的可能性极低。

抗分叉性

在两种可能的累计证实数的方法中（最新消息驱动 LMD，只有在最新的出块时段中的证实会被采纳；及时消息驱动 IMD ，采纳全部的证实），后者提供较好的抗分叉性保证（详见此文关于分叉性的章节），但相比于其余拜占庭共识算法仍然不够好。

本文描述了以太坊 2.0 中的 LMD 方法，虽然这种方法对分叉性的抵抗较弱。为了更好了解这一点，假设某条分支中有 60 个证实者，其中有部分恶意节点；另一条分支有 40 个证实者。在 IMD 场景下，须要在那 60 个证实者中出现 21 个恶意证实者为具备 40 个证实者的分支作证实，才能改变原有主链选择的结果（最终为 61 个证实数 vs 60个证实数，原来被选择的主链上只有 60 个证实）；在 LMD 场景下，只要出现 11 个恶意节点就能达到分叉目的（最终为 51 个证实数 vs 49 个证实数，原来被选择的主链上只有 49 个证实）。尽管 LMD 可以减小分叉发生，加上主链有超过 2/3 占比的证实数且恶意节点占比不到 1/3 ，咱们仍没法彻底避免分叉发生。咱们考虑下面的例子：

假设有七个验证者，其中 Alice (A)、Bob (B)、Carol (C)、Dave (D) 和 Elaine (E) 是诚实节点，而 Xavier (X) 和 Yasmine (Y) 是恶意节点。

(i) 如今出现了分叉，第 2 和 3 出块时段都接着第 1 个出块时段的区块出块，而 Alice 和 Bob 看到第 2 个出块时段生成的区块，并为它提供证实；

(ii) Carol 没有看到第 2 个出块时段的区块和证实，而只看到第 3 个出块时段建立的区块。因而 Carol 和恶意节点 Xavier、Yasmine 替区块 3 提供证实；

(iii) 如今区块 3 拥有三个证实，因此 Alice 和 Bob 就会认为包含第 3 个出块时段的分支才是主链，所以他俩也对区块 3 进行证实（假设证实时间窗口还没结束）。如今区块 3 具备超过 2/3 占比的证实数，理应不可逆；

(iv) 但其实 Dave 和 Elaine 在有效期间也对区块 2 进行证实，却由于网络延迟问题没有及时被看到（Alice 和 Bob 也没看到）；

(v) 这时候，恶意节点 Xavier 和 Yasmine 选择在第 4 个出块时段建立块，并接续在本来应该被抛弃的区块 2 上。一时之间，上分支证实数（Dave, Elaine, Xavier 和 Yasmine）反超下分支的证实数（Carol, Alice 和 Bob），前者成为主链（即便下分支一度存在超过 2/3 占比的证实数）；

(vi) 如今全部诚实的证实者都会对区块 4 进行证实。

注意，上述的攻击很难成立（好比 Dave 和 Elaine 出现延迟的状况；在有数百验证者的网络中很难发生，除非攻击者控制了整个网络通讯），这对做恶手段也有很高的要求（Xavier 和 Yasmine attesting 要先知道他们证实的区块不会被选为主链，但这仍表示 LMD 方法不如拜占庭共识算法来的强健）。

和 TxFlow 比较

TxFlow 是 Near 用于其分片链的共识算法，关于 TxFlow 的细则能够在这里找到。

以太坊采起的方法的两个缺点是：即使积累大量证实，理论上分叉仍然可能发生，并且很是依赖验证者之间的时间同步。目前协议中，出块速度为 8 秒，因此要求时间同步精度在数秒之内。以太坊基金会进行过的测试代表，若时间差在 10 秒之内，链仍然会继续增加。大多数证实会变成“跳过该区块”操做，但仍然能指向正常的区块，使得链稳定增加。

TxFlow 继承了大多数以太坊方法中的特色，可是不依赖时间同步；只要求恶意节点少于 1/3 则正常区块就是不可逆的。然而，在目前的设计中，只要超过 1/3 的验证者掉线，整个链就会丧失活跃性。

注脚：请注意，当分片数量不少，且恶意身份能灵活切换时，假设恶意节点少于 1/3 占比是不合理的。因此包含 TxFlow方法在内的其它拜占庭协议，最终仍有可能发生分叉。

值得一提的是，EthResearch 在 TxFlow 上测试时，Vitalik 指出 TxFlow 方法中决定何时出块的设计（“网速多快，就出多快”）有其余缺点：这会促使节点们抱团，以减小延时。对此指控的反驳是， TxFlow 方法的瓶颈来自“速度最慢的 1/3 节点里，其中最快的验证者的延时”。也就是说，除非超过 2/3 占比的验证者联合起来，否则没法有效提升出块速度（也没法增长出块奖励）。因此 TxFlow 的验证者发生抱团或中心化，须要大多数验证者共同为之，这在验证者基数足够大的状况下很难发生。

下表将 TxFlow 方法和证实（ Attestations）框架进行简化对比：

结语

若是你对分片的去中心化帐本有兴趣，请关注咱们的进展：

NEAR 推特

—
twitter.com/nearprotoco…,
My 推特— twitter.com/AlexSkidano…
Medium — medium.com/nearprotoco…,
Discord — discord.gg/kRY6AFp,
研究论坛 — research.nearprotocol.com

很是感谢 Vitalik Buterin, Justin Drake 和 Danny Ryan 进行无数的答疑，并明确了证实框架；还要感谢 Bowen Wang 和 David Stolp 校对本文。

原文连接: https://medium.com/nearprotocol/detailed-overview-of-ethereum-2-0-shard-chains-committees-proposers-and-attesters-a9992d2fd103
做者: Alexander Skidanov
翻译&校对: IAN LIU & 阿剑
稿源：以太坊爱好者（https://ethfans.org/posts/detailed-overview-of-ethereum-2-0-shard-chains-committees-proposers-and-attesters）复制代码