关于BCH,黑粉们讨论最多的就是BCH区块过大形成的节点存储问题,部分比特币的支持者认为,BCH大区块会加剧全节点的运行成本,使得人人皆节点变的再也不可能,有悖去中心化本意。对此,BCH社区已经罗列出了大量的事实和证据来代表BCH大区块并不会形成存储困难,也不会影响去中心化的设计,并且即便是比特币的节点运行,也早就超过了普通电脑可以接受的范围。因此,大区块撑爆屌丝电脑是一个针对BCH的谎话。node
不过,随着区块中交易的增多,帐本数据的持续增加,BCH全节点的运行成本愈来愈高是一个不争的事实。如何解决这个问题,是社区始终在思考的一个方向。近日,UTXO Commitment技术为了这一问题提供了一种解决思路。算法
UTXO是什么?bootstrap
UTXO(Unspent Transaction Output)是指未花费的交易输出,在现实世界中是没有比特币的,只有UTXO。比特币的交易由交易输入和交易输出组成,每一笔交易都要花费(spend)一笔输入,产生一笔输出(output),一个地址中出现了输入而这笔输入没有输出或者是彻底输出,剩余的部分指的就是“未花费过的交易输出”,也就是UTXO。安全
简单统计一下 BCE 和BCH 主链截止到某个最近的区块时的 UTXO 数据。BCH 的主链截止高度534637,UTXO集合有39922839个未花费的输出;BCE主链截止高度527687,UTXO集合有51283037个为花费的输出。微信
由此可得,UTXO集合较大,其中的unspent output的量级在4000万到5000万这个量级之间,须要的存储也会超过2GB。一样UTXO集合自己也会随着新区块的产生不断变化,花费旧的output,生成新的unspent output。网络
另外某些 output 多是没法花费的 output,这包括:1)第一个字节为 0x6a开头的redeemScript(OP_RETURN);2)超过10k字节的 redeemScript。函数
如何下降全节点存储成本?区块链
在文章的前面,我提到说BCH全节点的运行成本愈来愈高是一个不争的事实,举一个简单的例子来讲,若是如今要设置一个新节点,须要从BCH网络节点中下载区块链的完整历史数据,这个数据目前大约为160GB,这不只须要新节点拥有高速稳定的宽带以及较大的硬盘空间,并且其他节点也会由于初始块下载而承受网络压力,再加上区块链是不断延伸的,帐本的长度还在不断增长。ui
即便这个帐本数据过于庞大,目前来看咱们仍是须要下载运行,由于这个帐本里面的所有数据都是为了给UTXO集合作担保,保证每笔交易都是合法的,即每笔交易中的输出地址中有足够的UTXO来知足交易条件。那么咱们有没有可能不下载所有的历史数据就达到目的呢?设计
所有历史数据的存在是为了验证新的区块,也就是为验证新的交易(transaction,tx)提供依据。可是如今的Bitcoin客户端在实现验证新tx时,是否真的会直接去整个区块链上进行回溯来验证tx的合法性?
答案是否认的。如今的Bitcoin客户端在验证tx时,利用的是UTXO(Unspent Transaction Output)集合进行检查。因此为何必定须要所有的历史数据构建UTXO集合?能够认为:完整的帐本数据的存在是为了给UTXO提供担保。若是有其余的方式能够为UTXO集合提供担保或者承诺(commitment),也许就再也不须要存储整个的帐本数据。
UTXO Commitment就是如此,该技术给出的解决思路是用基于椭圆曲线构造的Hash函数(承诺算法)Elliptic Curve Multiset Hash来对UTXO集合进行担保,该算法将集合中的每个数据都Hash到椭圆曲线中的每个点,而后利用加法点群的运算来快速变换成杂凑值的变化,从而使得新地址同步的顺序发生改变,节点运行时率先同步新区块而后同步UTXO余额,最后是选择性同步旧数据,简单来讲就是对以前的冗余数据在不影响网络安全正确的前提下进行了适当的裁剪。
这样一来,全节点在运行BCH区块链时,可能只须要下载大小约为2GB的UTXO集,而不须要完整的下载160GB的历史帐本数据,会大大下降全节点的运行成本,也为普通节点的运行提供了可能。
UTXO Commitment是什么?
UTXO Commitment也叫UTXO证实或者是UTXO承诺,其大体思路利用ECMH 对某个区块高度的UTXO集合作承诺,并将该承诺存储到coinbase 交易的output中,完成这一步以后,后续根据新区块的产生能够对UTXO Commitment进行更新,利用ECMH把花费的output从集合中去掉并添加新产生的output。经过这种方式就找到了构建并持续维持UTXO承诺的方式,也能够从这里摆脱对完整帐本的依赖。
Utxo-commitment机制激活以后,网络中的节点只须要为可能发生的区块重组保持最近的几百(几千或者上万个区块)以及UTXO集合,就能够验证tx的合法性,而UTXO集合的合法性能够对比验证区块中的存储的commitment数据。固然,激活utxo-commitment机制时,例如在区块中首次生成utxo承诺时,仍是依赖所有的历史数据来保证该UTXO集合的合法性,可是今后以后,就再也不依赖完整的区块数据。相似于概括法证实:起点处的UTXO证实是正确的(全帐本数据支撑),每一次更新是对的(ECMH 的抗碰撞特性保证),则整个UTXO证实机制是没有问题的。
在主链上开启UTXO-commitment机制,大概须要如下四步:
1. 在coinbase中引入并维护UTXO承诺(这一步已经完成,在Bitcoin Cash Testnet的1237565高度的区块的coinbase中有了UTXO承诺:5554583011007bc4426b03824ccca5912bb147bd9f6847b670a08f24b79a4b5ed0b36393)。
2. 为UTXO集合的网络传送添加P2P消息支持:utxo/getutxo。
3. 将UTXO承诺做为区块验证规则的一部分。
4. 实现fast-syncing bootstrap方法。
UTXO Commitment的优势是什么?
UTXO承诺的优势,可以减小存储空间和带宽使用。因为仅须要存储UTXO集合和最新的几百个(或者几千或者上万个区块),而不须要存储超过 100GB 的数据,对存储空间的需求会减小(手动修剪也能够达到相似的效果)。
2017年2月的一则新闻中通告 https://news.bitcoin.com/cost-full-bitcoin-node/,Bitcoin节点一般每个月使用200GB或者更多的上行带宽和大约20GB的下行带宽。而使用了UTXO承诺以后占用更少的资源可使更多的节点可以以接近全节点的方式来运做,这可以加强BCH网络的去中心化程度和而且在必定程度上加强SPV钱包的安全性(能够经过存储2GB的UTXO集合来验证交易合法性)。
UTXO Commitment的安全性?
UTXO Commitment的安全取决于ECMH算法的安全性,而ECMH算法能够基于secp256k1椭圆曲线来构造,Core开发者Pieter Wuille等人开发的secp256k1库上基本都添加了ECMH功能。另外,secp256k1已经被别的数字货币进行使用,因此其安全性是通过验证的。
UTXO Commitment的缺点是什么?
UTXO承诺也有缺点,若是没有人愿意当全节点存储全部历史数据如何处理?另外在Telegram上的UTXO-Commitment的工做组[WG]讨论中,有人提出UTXO-Commitment机制可能会影响HD钱包的某些机制,这部分还没有彻底弄明白。
引入UTXO包含/不包含证实对于轻钱包的加强也会有帮助,可是进一步的考虑会发现这是徒劳的,由于payment协议也在不断改进。另外UTXO集合同步容易遭受恶意节点干扰,可能会由于仅仅一个output的错误而不断从网络从新获取2GB 的数据。
目前UTXO-Commitment仍是存在不少缺陷,但这不会影响UTXO-Commitment的政治正确性,为了实现保证全人类级的交易处理能力和去中心化全节点成本下降,UTXO-Commitment也是必须实现的技术。期待技术团队在将来可以完全完善UTXO-Commitment,早日应用在BCH上。