软件开发架构师

1分钟了解“挖矿”的本质

区块链 158 2019-03-07 10:08

上一篇《1分钟了解区块链的本质》,介绍了什么是区块链,区块链是一个没有管理员,每个节点都拥有全部数据,高可用的分布式存储系统。

 

文章的留言里,不少朋友会用比特币来解释区块链,那区块链与比特币是什么关系?

区块链是分布式存储,比特币是基于该存储的应用,其他诸如莱特币,以太币都是基于区块链的电子货币应用。理论上,使用上层应用来解释底层存储是不合适的。

如上图,mysql是底层存储,wechat是上层应用,用wechat来解释mysql是不合适的。

 

今天,从技术的角度出发,聊聊什么是区块链里的“挖矿”。

 

先说结论,区块链挖矿的本质是啥?

生成一个区块,链入区块链的过程,就是挖矿。挖矿的人,就是矿工。

 

什么是区块(block)?

:如《1分钟了解区块链的本质》里所述,区块是一块存储空间,可以存储数据。

如上图,区块分为区块头header区块体body

 

区块体(body)存了些什么?

想存什么存什么,和上层应用有关,就像mysql里存什么依赖于上层应用。例如比特币使用的区块链,区块体里存储的是比特币交易记录。

 

区块头(header)存了些什么?

:区块头里存储了和这个区块,以及区块链相关的一些元数据

如上图,区块头里的三个常见属性:

  • 前一个区块的哈希值

  • 区块生成的时间戳

  • 随机数

 

什么是区块链(blockchain)?

区块是怎么链起来的?

struct node{

         node* prev; // 前一个节点

         int time; // 时间戳

         int nonce; // 随机数

         void* node_body; // 存储数据

}node;

链表,节点指针可以作为这个节点的唯一标识,下一个节点通过存储上一个节点的指针,将链表链起来。

 

与之类似,区块的哈希可以作为区块的唯一标识,下一个区块通过存储上一个区块的哈希,将区块链起来,这就是区块链。

 

讲完区块与区块链的概念,接下来讲挖矿,也就是区块的生成

在此之前,先说说区块链的三个特性

  • 历史生成的区块是无法改变的,即“区块链只能像写日志一样追加写,不能像mysql一样随机写”

  • 只能在最新的区块后面生成新区块,即“必须先完成同步全网最新的区块链数据这项工作,才能启动新区块生成这项工作”

  • 新区块的生成很难,必须满足一定条件的新区块才有效

 

假如已经同步了最新的区块链数据,要满足什么条件,才算生成一个新的区块,才算“挖矿”成功呢?

对最新的区块头进行两次SHA256计算,得到的256bit哈希结果,高位48bit必须是0x00000000FFFF,才算挖矿成功

画外音:这句话很重要,是这篇文章的核心。

 

为什么大家都说“挖矿”很难?

由符合条件的哈希值,倒推出区块头,填入相应的“前一块区块哈希值”“时间”“随机数”不就可以了吗?

:额,这,,,哈希(SHA256是一个哈希算法)是不可逆的。例如MD5

md5(string) = md5_result

大家都知道:

  • 由字符串,算出对应的md5值很容易,但md5值反推出字符串是不可能的

  • 可以认为哈希的结果是完全随机的,要得出前48bit必须是0x00000000FFFF的哈希结果,就如同连续抛48次硬币,每次都得到我们想要的结果,其概率为(1/2)^48


可以看到,这就好比在一座山上随手捡起一块石头,正好是一块金子,我猜测,这也正是把生成新区块叫做“挖矿”的原因。

 

那应该怎么找到符合条件的区块头呢,从而成功挖到矿呢?

穷举法


区块头里有个随机属性nonce,将这个属性0开始,遍历到2^32,来计算区块头的哈希值,如果得到的哈希结果符合条件,则挖矿成功。


其伪代码如下:

byte[32] = PrevBlockHash; // 上一个区块的哈希

for(int i=0 to 2^32){ // 遍历所有整数

  int time=now(); // 时间戳

  blockHeader= new(byte[32], time, i); // 生成区块头

  hashResult= SHA256D(blockHeader); // 计算哈希值

  if(hashResult>>208 == 0x00000000FFFF){ //哈希符合预期

    echo“bingo”; // 挖到矿啦

}

}

 

看上面的算法,只要程序运行时间足够久,总能挖到矿呀?

:错,如果别人计算能力强,在你挖到矿之前,如果别人先生成了新区块,广播到了区块链网络,你本地不是最新的区块链,你挖到的矿就作废啦,此时你要放弃之前所有的工作,先向网络同步最新的数据,再重新开始挖。

 

有什么方法可以提升挖矿的速度呢?

:从架构的角度出发

  • “缓存”是无效:每个区块的哈希值都不一样,每个时间戳都不一样,历史计算过的值无法通过“查表”来节省时间

  • scale up有效:增强单CPU的计算能力,使用GPU代替CPU,使用特殊的芯片计算SHA256D等优化都是有效的,但scale up总是有极限的,单机总会遇到瓶颈

  • scale out有效:单机不行,来并行,一台机器不行,搞集群,这就是为什么会有这么多的矿场

如上图,这是西藏高原上的一个比特币矿场,廉价的电力让无数矿工趋之若鹜。

 

综上,区块链里,什么是挖矿?

在最新区块链的数据上,生成一个符合条件的区块,链入区块链的过程,就是挖矿

 

关于区块链与挖矿,大家或许还有不少疑问:

  • 如何保证数据的一致性

  • TM有病吧,挖这玩意有什么意义,不是纯浪费电吗

  • 这和比特币有什么关系

  • 比特币怎么保证总量有限

这些疑惑,下一个一分钟,再和大家解释。

 

希望这很短的一分钟,大家了解了挖矿的本质。


前序文章:

1分钟了解区块链的本质

文章评论