AsicBoost和SegWit
关于AsicBoost和SegWit的讨论已经冷清了很多,但我还是想从技术的角度尝试解释下:
- AsicBoost是什么
- AsicBoost和SegWit有什么关系
在说这两件事情之前,离不开一个关键词:挖矿
,那就先来说说挖矿吧!
挖矿
比特币的挖矿机制:比特币挖矿机制采用的是SHA256算法,但SHA256算法并不是针对整个块做的,而是只是针对块头(Block Header)做SHA256,下图是block的组成:
block
从上图中可以看到Block hash是从哪些字段组合之后再做hash而得到的,其中黄色背景的字段就是块头,它包含:
- 版本号
- 上一个块的hash
- Merkle root
- timestamp(时间戳)
- bits(难度)
- Nonce (随机数)
在一轮挖矿过程中,其中的版本号、上一块的hash、难度都是确定的,矿工需要做的就是不断的修改Nonce,以改变当前块的hash值以找到小于当前难度的Block Header
。
但Nonce的可用搜索空间是不够的,原因就是Nonce的位数只有4bytes。Block Header中各字段所占的位数:
4bytes的Nonce的意味着他的搜索概率空间为
2^32
,也就4G次的hash运算就能遍历完,对于当前的单个矿机来说也就是一瞬间就可以完成的事。在Nonce的搜索空间不够的情况下,就只剩下
timestamp
和Merkle root
可以改变了,timestamp可以前后调整,但是调整之后的搜索空间还是不够。矿工通过修改Coinbase交易、或者交易顺序、或者其他的方式,获取新的
Merkle Root
,再重新做2^32次Nonce的遍历。而Merkle Root
是32 bytes,它的搜索空间足够大。总结比特币的挖矿:
简单来说比特币挖矿就是通过不断更改Nonce来改变块hash以寻找小于当前难度的Block Header,但是Nonce的搜索空间太小了,在做完2^32次哈希没有找到对应的块头就需要变更Merkle Root重新计算。
上面说了简单说了下比特币挖矿机制,那AsicBoost
又是怎么回事呢?
AsicBoost
AsicBoost
是和SHA256的计算
、Block Header结构
有关的一种算法,在开始计算块头hash的时候是需要补齐到128 bytes再做SHA256计算,而上面所示块头只有80 bytes,剩下的需要使用固定的48 bytes填充到128 bytes。
而在计算128 bytes
的hash的过程是分两个过程进行的,前64 bytes一起计算,后64 bytes一起运算:
这样一个被填充过的块头就被分成了两个部分,比较有意思的是Merkle Root,Merkle Root的32个bytes中前28个bytes被放在前部分计算,后4个bytes被放在后部分计算,
Block Header hash
的计算公式为:
SHA256=F(Chunk1)+B(Chunk2)
Chunk1=(version)+(Previous hash)+F28(Merkle root)
Chunk2=B4(Merkle Root)+Timetamp+Bits+Nonce+padding
结合上面所述,块hash计算时就出现了一个现象:
每次更改Nonce的值的时候,Chunk1的值保持不变,这意味着每次变更Nonce的时候只需要重新计算
B(Chunk2)
再结合上一次计算的F(Chunk1)
即可。
这是一种优化挖矿的方法,优化之后每一轮在可搜索空间中变更Nonce,计算SHA256的公式就变成了:
SHA256=F(Chunk1)(不变)+B(Chunk2)`
基本上所有的矿机都做了这个优化。而AsicBoost
在这个优化的基础上又延伸了思路,找到了另一种优化方法:
既然可以保持
Chunk 1
不变,有没有办法保持Chunk 2
不变呢?从前面的公式中可以看到只要保持Merkle Root
的最后4位、时间戳、和Nonce不变的情况下即可保持Chunk 2
不变。
如果能够找到Merkle Root
后四位是相同的话,那么在同一个timestamp和Nonce不变的情况下,就可以得到另一个优化公式:
SHA256=F(Chunk1)`+B(Chunk2)(不变)
对于timestamp来在一轮挖矿过程中它基本是不变的,而Nonce是在2^32内搜索空间内遍历的,剩下的问题就是要找到足够多的后四位相同的Merkle Root
,这样在每次遍历Nonce时就可以复用后部分的计算结果,就有效的减少了计算,提高了找到块hash的概率。
前面说过可以通过改变交易顺序、更改Coinbase等方式得到新的Markle Root,这样就可以通过碰撞找到后4位相同的Merkle Root,那通过碰撞找到后4位相同的hash的概率是多少呢?根据"生日悖论"(后4位相同的bytes就是32 bits相同的概率),它的概率是:
大概碰撞77000次就有50%的概率会出现后四位相同的hash,而这样的碰撞能提高多少概率呢?AsicBoost白皮书中给出现的结果:
这种优化理论上能够提高20%的碰撞效率,而合并的性能提升大概是7%左右。
AsicBoost
可以在软件上实现,也是通过芯片(硬件)上实现。变更Merkle Root
的方法:
- 修改Coinbase交易,白皮书认为不够高效
- 另一种就是更新Merkle树的排序
- ...其他方式
可以看出AsicBoost
是一种基于比特币块头和SHA256算法做出的优化,并不是一种攻击。
AsicBoost只有一种技术优化
很明显AsicBoost既没有破坏现在的比特币协议,也没有生产出不可用的块,更不会出现针对比特币的安全问题。
而基于SHA256算法的优化在比特币历史中也出现了好几次:
- 前边提到的变更Nonce的时候,前半部分F(Chunk1)并不需要重新计算
- 后部分的前三轮也是可以优化的参考ms3steps
- ......
- AsicBoost
可以这样说所有的软件和系统都存在被优化的可能性,比特币的挖矿历史就是一部不断优化效率的过程。
究竟我们应该如何定义优化
和攻击
呢?这是一个值得思考的问题。优化SHA256前64位的计算是允许的,优化后64位的计算就是攻击
了吗?
AsicBoost
是一个优化算法,只是在原有的比特币挖矿基础上提高了碰撞hash的概率,用来找到更合适的Block Header
,提高了找到块头的概率,并不是漏洞
如果存在一种提升比特币挖矿效率的技术,我更希望矿工早日应用上这种技术,这样攻击者和矿工相比就不存在技术优势。毕竟算力才是比特币安全的基础,攻击者在技术上领先矿工的话,比特币被攻击的可能性会增加很多。
介绍完了AsicBoost
,再来看下AsicBoost
和SegWit又有什么样的关系呢?
SegWit和AsicBoost
SegWit(Segregated Witness)即隔离验证,它的应用将会对TX有所改变,它将会采用一种新的TX ID:Witness ID
相应地 Witnesss ID就对对应有
Witness Merkle Tree
,继而就有了Winess Merkel Root
,而Winess Merkel Root
写在哪里呢?答案就是Coinbase
。在
SegWit
协议中Coinbase会增加一个新的output,新的output为:
output_data = WITNESS_COMMITMENT_HEADER + ser_uint256(uint256_from_str(hash256(ser_uint256(witness_root)+ser_uint256(witness_nonce))))
script = CScript([OP_RETURN, output_data])
新增的output包含:OP_RETURN+WITNESS信息+Witness Merkle Root
的hash组成的Script。
而Witness Merkle Root
的计算是不包括Coinbase
的,这样就避免了Coinbase和Witness Merkle Root
相互改变而造成的死循环。
这样就出现了一个问题,就是如果在SegWit
中变更任意交易位置的话就会导致Witness Merkle Root
的变化,而Coinbase中是要包含Witness Merkle Root
的信息,这样就会影响Coinbase的变化,Coinbase的变化会导致整个块的Merkle Root发生了变化。
如果在SegWit中使用的AsicBoost是通过变更交易顺序获取新的Merkle Root了,效率就会降低,因为需要同时计算Witness Merkle Root
和Merkle Root
,进而降低AsicBoost
的效率。
这就是SegWit对于AsicBoost的影响。但不能忽略了一条重要的事实:SegWit
和AsicBoost
并不是互斥的:
只要块头结构不变的情况下
AsicBoost
的优化仍然存在,仍然有效。
在SegWit中变更Coinbase获取Merkle Root
的方式和当前协议中变更Coinbase的效果是一样的,因为Witness Merkle Root
中并不包括Coinbase TX。
SegWit并不是和AsicBoost是互斥的,并不是在SegWit中就不存在AsicBoost的优化了。而在SegWit
中使用AsicBoost
在工程上也是可以进行优化的:计算Merkle Root也是要计算hash的,可以在计算Merkle Root不时阻塞块hash的计算,并行计算会是一种更好的优化方式,在并行的情况下使用变更Coinbase
获取Merkle Root
所带来的效率的降低并不会特别明显。
总结
AsicBoost的原理:
在计算块头的时候,Merkle Root被分割成了两个部分计算,导致了如果使用后4位相同的Merkle Root去计算块hash的话,会提高挖矿的效率
SegWit:
SegWit 需要使用
Wintess TX ID
,继而有了新的Witness Merkle Root
,而Witness Merkle Root
是会写进Coinbase的,Coinbase本身是不会写入Witness Merkle Root
的。因为软分叉的原因,块头的结构并没有变化。
根据上面所述可以得出以下结论:
AsicBoost本质上只是基于块头结构和SHA256算法其中的一种优化
AsicBoost和SegWit并不互斥
块头结构和SHA256算法不变的前提条件,AsicBoost
会一直存在。
SegWit会对于AsicBoost中交易互换的方式有影响
在SegWit中,每次的变更交易顺序都会导致Coinbase的变化,继而需要重新计算Merkle Root
。交易顺序的变更会导致Witness Merkle Root
和Merkle Root
的变化。
如果有更好工程化地优化AsicBoost的方式,在SegWit中仍然有效
除了变更交易顺序更新Merkle Root的方式效率会降低以外,使用工程化优化AsicBoost的方式仍然可以有效。比如并行计算等方式
AsicBoost
只是一种优化挖矿的方式,而且在SegWit中AsicBoost
优化也没有消失,因为块的结构并没有改变。G Maxwell在邮件中提出了一种更改块头的方式让AsicBoost
不能再继续使用,我并不反对这种提议,只是认为没有这个必要,如果不允许矿工优化后64为bytes的计算,那前64位bytes的优化计算是不是也应该想办法禁止掉呢?而且未来说不好还会出现其它类似的优化,难道都要禁止掉吗?
在给定的条件下,人类总是有办法找到方法A优于原来的方法B的,人类的历史就是效率不断被提高的历史
分享看到的一个微博,分享下: