2018-04-13:区块链学习笔记
1. 首先理解区块链区块的构成以及凭什么不能被篡改:
简单来说:
对于创世区块,value=hash(时间,交易记录,区块序号0)
对于之后的区块,value=(previous_value,时间,交易记录,区块序号1)
以此类推进行区块的建立,因此只要最后一个区块验证成功,则可以说整个区块链没有问题,因为改前面的区块会把每一个hash值进行改变。
2. 理解交易时如何确定交易人的所有权:
在比特币这个系统里,交易是用地址进行表示的,例如一条转账记录的表示:
{
"付款地址":"2A39CBa2390FDe"
"收款地址":"AAC9CBa239aFcc"
"金额":"0.2btc"
}
比特币的解决方案是,谁拥有某个地址的私钥(如果完全没有加密概念的人,可以简单的把私钥当作密码),谁就能用这个地址进行支付。
比特币地址和私钥是一个非对称的关系,私钥经过一系列运算(其中有两次Hash)之后,可以得到地址, 但是无法从地址反推得到私钥。
拥有私钥,相当于你拥有了某一个地址的使用权
那么,如何证明你拥有了一个私钥呢?(相当于如何验证你这个私钥呢?)
比特币系统利用了签名这种方式,具体操作如下:
1.对交易进行hash, 得到一个摘要信息(Hash值)
hash('
{"付款地址":"2A39CBa2390FDe",
"收款地址":"AAC9CBa239aFcc",
"金额":"0.2btc"
}') -> 8aDB23CDEA6
2.签明:用私钥对交易摘要进行签名(付款方在安全的环境下进行,以避免私钥泄密), 用代码表示大概是这样。
#返回签名信息
参数2就是我们的私钥
sign("8aDB23CDEA6", "J78sknJhidhLIqdngalket") -> "3cdferdadgadg"
3. 广播:广播过程实际上是发信息到相连的其它节点,其它节点在验证通过后再转发到与之相连的节点,这样的扩散过程。广播的信息包含了交易原始信息和签名信息.
就像是:我支付了0.2btc到AAC9CBa239aFcc,签名信息是3cdferdadgadg,你们来确认一下吧。
4. 验证:其它节点在收到广播信息之后,会验证签名信息是不是付款方用私钥对交易原始信息签名产生的,如果验证通过说明确实是付款方本人发出的交易,说明交易有效,才会记录到账本中去。
验证过程实际是签名过程的逆运算,用代码表示大概过程是这样的:
#参数1为签名信息
#参数2为付款方地址
#返回交易摘要
verify("3cdferdadgadg", "2A39CBa2390FDe") -> "8aDB23CDEA6"
如果验证输出的信息和原始交易信息的hash一致,则验证通过,记录账本。
所以我们一般称验证所需要的公开的那个付款地址为公钥。
我们可以看到整个认证的过程是sigh和verify函数相互配合
注:说实话不太知道这个verify和sign的程序该怎么编???可以看看Python的那个程序
比特币系统使用了椭圆曲线签名算法,算法的私钥由32个字节随机数组成,通过私钥可以计算出公钥,公钥经过一序列哈希算法和编码算法得到比特币地址,地址也可以理解为公钥的摘要。
3.理解POW(工作量证明机制)
记账需要消耗资源进而需要给予奖励,为了避免大家正向记账使账本发生偏差,因此记账有一定的规则:
1. 一段时间内(10分钟左右,具体时间会与密码学难题难度相互影响)只有一人可以记账成功
2. 通过解决密码学难题(即工作量证明)竞争获得唯一记账权
3. 其他节点复制记账结果
不过在进行工作量证明之前,记账节点会做进行如下准备工作:
1. 收集广播中还没有被记录账本的原始交易信息
2. 检查每个交易信息中付款地址有没有足够的余额
3. 验证交易是否有正确的签名
4. 把验证通过的交易信息进行打包记录
5. 添加一个奖励交易:给自己的地址增加12.5比特币
如果节点争夺记账权成功的话,就可以得到12.5比特币的奖励。
那么到底怎么进行工作量证明呢?矿机们每天都在干什么呢?
因为其实记账只是hash的一个过程,我们了解到,每次记账的时候会把上一个块的Hash值和当前的账页信息一起作为原始信息进行Hash。
为了保证10分钟左右只有一个人可以记账,就必须要提高记账的难度,为了就用规定hash结果的方式提高难度,比如:在input中引入随机数,并且使得Hash的结果必须以若干个0开头。
例:
原:Hash(上一个Hash值,交易记录集) = 456635BCD
现在:Hash(上一个Hash值,交易记录集,随机数) = 0000aFD635BCD
因此在运算Hash时,不断的改变随机数的值,总可以找的一个随机数使的Hash的结果以若干个0开头(下文把这个过程称为猜谜),率先找到随机数的节点就获得此次记账的唯一记账权。
这就是矿机干的事情,不断的试验出符合条件的哈希值。
# 没有难度时为:Hash(上一个Hash值,交易记录集) = 456635BCD
Hash(上一个Hash值,交易记录集,随机数) =0000aFD635BCD
我们知道改变Hash的原始信息的任何一部分,Hash值也会随之不断的变化,因此在运算Hash时,不断的改变随机数的值,总可以找的一个随机数使的Hash的结果以若干个0开头(下文把这个过程称为猜谜),率先找到随机数的节点就获得此次记账的唯一记账权。
一旦你率先找到了符合条件的哈希值便可以进行全网广播验证,如果验证通过,则表明已经有节点成功解迷,自己就不再竞争当前区块打包,而是选择接受这个区块,记录到自己的账本中,然后进行下一个区块的竞争猜谜。网络中只有最快解谜的区块,才会添加的账本中,其他的节点进行复制,这样就保证了整个账本的唯一性。
假如节点有任何的作弊行为,都会导致网络的节点验证不通过,直接丢弃其打包的区块,这个区块就无法记录到总账本中,作弊的节点耗费的成本就白费了,因此在巨大的挖矿成本下,也使得矿工自觉自愿的遵守比特币系统的共识协议,也就确保了整个系统的安全。
所以去中心化的绝对正确不造假的保证其实还是算力与成本之间的限制。
(如何完成交易验证是另外的一回事)
4. 理解共识机制
为什么有共识机制这种东西呢?因为挖矿的过程中总会产生分叉,比如两名矿工都在规定时间内算出了合适的常数满足hash值。那么此时区块链就回分叉,在矿工广播自己的挖矿消息的时候,新的矿工听到的消息就回有先后,那么也会就先听到的那个消息继续挖下去。
因为比特币系统中规定好了只有最长链才是主链,才是有继续挖矿价值的的链条。??想看程序是怎么规定的??
因此我们总会在10分钟10分钟的间隔中,产生先发展出的明确的没有异议的一条最长链,主链就是这么被确认的。
我们可以认为,默认最长链就是主链就是比特币系统中的共识机制。