区块链 blockchain

1、区块链的本质

 

区块链是什么?一句话,它是一种特殊的分布式数据库。html

 

 

 

首先,区块链的主要做用是储存信息。任何须要保存的信息,均可以写入区块链,也能够从里面读取,因此它是数据库。算法

 

其次,任何人均可以架设服务器,加入区块链网络,成为一个节点。区块链的世界里面,没有中心节点,每一个节点都是平等的,都保存着整个数据库。你能够向任何一个节点,写入/读取数据,由于全部节点最后都会同步,保证区块链一致。数据库

 

2、区块链的最大特色

 

分布式数据库并不是新发明,市场上早有此类产品。可是,区块链有一个革命性特色。服务器

 

区块链没有管理员,它是完全无中心的。其余的数据库都有管理员,可是区块链没有。若是有人想对区块链添加审核,也实现不了,由于它的设计目标就是防止出现居于中心地位的管理当局。网络

 

正是由于没法管理,区块链才能作到没法被控制。不然一旦大公司大集团控制了管理权,他们就会控制整个平台,其余使用者就都必须听命于他们了。app

 

可是,没有了管理员,人人均可以往里面写入数据,怎么才能保证数据是可信的呢?被坏人改了怎么办?请接着往下读,这就是区块链奇妙的地方。分布式

 

3、区块

 

区块链由一个个区块(block)组成。区块很像数据库的记录,每次写入数据,就是建立一个区块。区块链

 

每一个区块包含两个部分。ui

 

  • 区块头(Head):记录当前区块的元信息加密

  • 区块体(Body):实际数据

 

区块头包含了当前区块的多项元信息。

 

  • 生成时间

  • 实际数据(即区块体)的 Hash

  • 上一个区块的 Hash

  • ...

 

这里,你须要理解什么叫 Hash,这是理解区块链必需的。

 

所谓 Hash 就是计算机能够对任意内容,计算出一个长度相同的特征值。区块链的 Hash 长度是256位,这就是说,无论原始内容是什么,最后都会计算出一个256位的二进制数字。并且能够保证,只要原始内容不一样,对应的 Hash 必定是不一样的。

 

举例来讲,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,并且只有123能获得这个 Hash。

所以,就有两个重要的推论。

 

  • 推论1:每一个区块的 Hash 都是不同的,能够经过 Hash 标识区块。

  • 推论2:若是区块的内容变了,它的 Hash 必定会改变。

 

4、Hash 的不可修改性

 

区块与 Hash 是一一对应的,每一个区块的 Hash 都是针对"区块头"(Head)计算的。

 

Hash = SHA256(区块头)

 

上面就是区块 Hash 的计算公式,Hash 由区块头惟一决定,SHA256是区块链的 Hash 算法。

 

前面说过,区块头包含不少内容,其中有当前区块体的 Hash(注意是"区块体"的 Hash,而不是整个区块),还有上一个区块的 Hash。这意味着,若是当前区块的内容变了,或者上一个区块的 Hash 变了,必定会引发当前区块的 Hash 改变。

 

这一点对区块链有重大意义。若是有人修改了一个区块,该区块的 Hash 就变了。为了让后面的区块还能连到它,该人必须同时修改后面全部的区块,不然被改掉的区块就脱离区块链了。因为后面要提到的缘由,Hash 的计算很耗时,同时修改多个区块几乎不可能发生,除非有人掌握了全网51%以上的计算能力。

 

正是经过这种联动机制,区块链保证了自身的可靠性,数据一旦写入,就没法被篡改。这就像历史同样,发生了就是发生了,今后再没法改变。

 

 

 

 

5、采矿

 

因为必须保证节点之间的同步,因此新区块的添加速度不能太快。试想一下,你刚刚同步了一个区块,准备基于它生成下一个区块,但这时别的节点又有新区块生成,你不得不放弃作了一半的计算,再次去同步。由于每一个区块的后面,只能跟着一个区块,你永远只能在最新区块的后面,生成下一个区块。因此,你别无选择,一听到信号,就必须马上同步。

 

因此,区块链的发明者中本聪(这是假名,真实身份至今未知)故意让添加新区块,变得很困难。他的设计是,平均每10分钟,全网才能生成一个新区块,一小时也就六个。

 

这种产出速度不是经过命令达成的,而是故意设置了海量的计算。也就是说,只有经过极其大量的计算,才能获得当前区块的有效 Hash,从而把新区块添加到区块链。因为计算量太大,因此快不起来。

 

这个过程就叫作采矿(mining),由于计算有效 Hash 的难度,比如在全世界的沙子里面,找到一粒符合条件的沙子。计算 Hash 的机器就叫作矿机,操做矿机的人就叫作矿工。

 

6、难度系数

 

读到这里,你可能会有一个疑问,人们都说采矿很难,但是采矿不就是用计算机算出一个 Hash 吗,这正是计算机的强项啊,怎么会变得很难,迟迟算不出来呢?

 

原来不是任意一个 Hash 均可以,只有知足条件的 Hash 才会被区块连接受。这个条件特别苛刻,使得绝大部分 Hash 都不知足要求,必须重算。

 

原来,区块头包含一个难度系数(difficulty),这个值决定了计算 Hash 的难度。举例来讲,第100000个区块的难度系数是 14484.16236122。

 

 

区块链协议规定,使用一个常量除以难度系数,能够获得目标值(target)。显然,难度系数越大,目标值就越小。

 

 

 

Hash 的有效性跟目标值密切相关,只有小于目标值的 Hash 才是有效的,不然 Hash 无效,必须重算。因为目标值很是小,Hash 小于该值的机会极其渺茫,可能计算10亿次,才算中一次。这就是采矿如此之慢的根本缘由。

 

区块头里面还有一个 Nonce 值,记录了 Hash 重算的次数。第 100000 个区块的 Nonce 值是274148111,即计算了 2.74 亿次,才获得了一个有效的 Hash,该区块才能加入区块链。

 

7、难度系数的动态调节

 

就算采矿很难,但也无法保证,正好十分钟产出一个区块,有时一分钟就算出来了,有时几个小时可能也没结果。整体来看,随着硬件设备的提高,以及矿机的数量增加,计算速度必定会愈来愈快。

 

为了将产出速率恒定在十分钟,中本聪还设计了难度系数的动态调节机制。他规定,难度系数每两周(2016个区块)调整一次。若是这两周里面,区块的平均生成速度是9分钟,就意味着比法定速度快了10%,所以难度系数就要调高10%;若是平均生成速度是11分钟,就意味着比法定速度慢了10%,所以难度系数就要调低10%。

 

难度系数越调越高(目标值愈来愈小),致使了采矿愈来愈难。

 

8、区块链的分叉

 

即便区块链是可靠的,如今还有一个问题没有解决:若是两我的同时向区块链写入数据,也就是说,同时有两个区块加入,由于它们都连着前一个区块,就造成了分叉。这时应该采纳哪个区块呢?

 

如今的规则是,新节点老是采用最长的那条区块链。若是区块链有分叉,将看哪一个分支在分叉点后面,先达到6个新区块(称为"六次确认")。按照10分钟一个区块计算,一小时就能够确认。

 

因为新区块的生成速度由计算能力决定,因此这条规则就是说,拥有大多数计算能力的那条分支,就是正宗的比特链。

 

9、总结

 

区块链做为无人管理的分布式数据库,从2009年开始已经运行了8年,没有出现大的问题。这证实它是可行的。

 

可是,为了保证数据的可靠性,区块链也有本身的代价。一是效率,数据写入区块链,最少要等待十分钟,全部节点都同步数据,则须要更多的时间;二是能耗,区块的生成须要矿工进行无数无心义的计算,这是很是耗费能源的。

 

所以,区块链的适用场景,其实很是有限。

 

1. 不存在全部成员都信任的管理当局

2. 写入的数据不要求实时使用

3. 挖矿的收益可以弥补自己的成本

 

若是没法知足上述的条件,那么传统的数据库是更好的解决方案。

 

 

 

目前,区块链最大的应用场景(可能也是惟一的应用场景),就是以比特币为表明的加密货币。

 

10、参考连接

 

  • How does blockchain really work?, by Sean Han:https://medium.freecodecamp.org/how-does-blockchain-really-work-i-built-an-app-to-show-you-6b70cd4caf7d

  • Bitcoin mining the hard way: the algorithms, protocols, and bytes, by Ken Shirriff:http://www.righto.com/2014/02/bitcoin-mining-hard-way-algorithms.html