区块链技术(P2)实现的原理
基本原理
区块链的基本原理理解起来并不难。基本概念包括:
- 交易(Transaction):一次操作,导致账本状态的一次改变,如添加一条记录;
- 区块(Block):记录一段时间内发生的交易和状态结果,是对当前账本状态的一次共识;
- 链(Chain):由一个个区块按照发生顺序串联而成,是整个状态变化的日志记录。
如果把区块链作为一个状态机,则每次交易就是试图改变一次状态,而每次共识生成的区块,就是参与者对于区块中交易导致状态改变结果的确认
比特币中的区块链
客户端发起一项交易后,会广播到网络中并等待确认。网络中的节点会将一些等待确认的交易记录打包在一起(此外还要包括此前区块的哈希值等信息),组成一个候选区块。然后,试图算出一道难题(找到一个 nonce 串放到区块里,使得候选区块的 hash 结果满足一定条件(比如小于某个值))。一旦算出来这个区块在格式上就合法了,就可以进行全网广播。大家拿到提案区块,进行验证,发现确实符合约定条件了,就承认这个区块是一个合法的新区块,被添加到链上。当然,在实现上还会有很多的细节。
区块链的抽象特征:
- 分布式的数据记录本
- 只允许添加、不允许删除
- 其结构是一个线性的链表,由一个个“区块”串联组成
- 新的数据要加入,必须放到一个新的区块中,而这个块(以及块里的交易)是否合法,可以通过一些手段快速检验出来
- 维护节点都可以提议一个新的区块,然而必须经过一定的共识机制来对最终选择的区块达成一致
比特币中的区块信息
- 账户、地址:非对称加密
- 交易信息:付款人地址、付款人签字、付款人资金来源、交易金额、收款人地址、收款人公钥、时间戳
- 交易验证:是否已被处理过、信息是否合法
- 区块:版本号、上一个区块HASH、交易集合的Merkle树根HASH、时间戳、难度指标、Nonce、交易个数
Hash算法
- 正向快速:给定明文和 hash 算法,在有限时间和有限资源内能计算出 hash 值
- 逆向困难:给定(若干) hash 值,在有限时间内很难(基本不可能)逆推出明文
- 输入敏感:原始输入信息修改一点信息,产生的 hash 值看起来应该都有很大不同
- 冲突避免:很难找到两段内容不同的明文,使得它们的 hash 值一致(发生冲突)
Merkle树
底层数据的任何变动,都会传递到其父亲节点,一直到树根
- 快速比较大量数据
- 速定位修改
- 零知识证明
PoW工作量证明
- Proof of Work,通过计算来猜测一个数值(nonce),得以解决规定的 hash 问题。保证在一段时间内,系统中只能出现少数合法提案
- 参与 PoW 计算比赛的人,如果有人恶意破坏,需要付出大量的经济成本
- 分叉也能保证一致性:例如超市排队
hash 问题具有不可逆的特点,因此,目前除了暴力计算外,还没有有效的算法进行解决。反之,如果获得符合要求的 nonce,则说明在概率上是付出了对应的算力。谁的算力多,谁最先解决问题的概率就越大。当掌握超过全网一半算力时,从概率上就能控制网络中链的走向。这也是所谓 51% 攻击 的由来。
参与 PoW 计算比赛的人,将付出不小的经济成本(硬件、电力、维护等)。当没有成为首个算出的“幸运儿”时,这些成本都将被沉没掉。这也保障了,如果有人恶意破坏,需要付出大量的经济成本。也有设计试图将后算出结果者的算力按照一定比例折合进下一轮比赛考虑。
超市付款需要排成一队,可能有人不守规矩要插队。超市管理员会检查队伍,认为最长的一条队伍是合法的,并让不合法的分叉队伍重新排队。只要大部分人不傻,就会自觉在最长的队伍上排队。
SHA256D(Blockheader) < F(nBits)
挖矿
- 挖矿是参与维护比特币网络的节点,通过协助生成新区块来获取一定量新增的比特币
- 每 10 分钟左右生成一个不超过 1 MB 大小的区块
- 每个区块的成功提交者可以得到系统 12.5 个比特币的奖励(一定区块数后才能使用)
- 每个区块的奖励一开始是 50 个比特币,每隔 21 万个区块自动减半,即 4 年时间,最终比特币总量稳定在 2100 万个
比特币的这种基于算力的共识机制被称为 Proof of Work(PoW)。目前,要让 hash 结果满足一定条件并无已知的启发式算法,只能进行暴力尝试。尝试的次数越多,算出来的概率越大。通过调节对 hash 结果的限制,比特币网络控制约 10 分钟平均算出来一个合法区块。算出来的节点将得到区块中所有交易的管理费和协议固定发放的奖励费(目前是 12.5 比特币,每四年减半)。也即俗称的挖矿。
很自然会有人问,能否进行恶意操作来破坏整个区块链系统或者获取非法利益。比如不承认别人的结果,拒绝别人的交易等。实际上,因为系统中存在大量的用户,而且用户默认都只承认他看到的最长的链。只要不超过一半的用户协商,最终最长的链将很大概率上是合法的链,而且随着时间增加,这个概率会越大。
闪电网络
比特币的交易网络最为人诟病的一点便是交易性能:全网每秒 7 笔的交易速度,远低于传统的金融交易系统;同时,等待 6 个块的可信确认导致约 1 个小时的最终确认时间。
闪电网络的主要思路十分简单 — 将大量交易放到比特币区块链之外进行。
比特币的区块链机制自身提供了很好的可信保障,但是很慢;另一方面考虑,对于大量的小额交易来说,是否真实需要这么高的可信性?闪电网络通过智能合约来完善链下的交易渠道。
核心的概念主要有两个:RSMC(Recoverable Sequence Maturity Contract)和 HTLC(Hashed Timelock Contract)。前者解决了链下交易的确认问题,后者解决了支付通道的问题。
RSMC
Recoverable Sequence Maturity Contract,中文可以翻译为“可撤销的顺序成熟度合同”。这个词很绕,其实主要原理很简单,就是类似准备金机制。
我们先假定交易双方之间存在一个“微支付通道”(资金池)。双方都预存一部分资金到“微支付通道”里,之后每次交易,就对交易后的资金分配方案共同进行确认,同时签字作废旧的版本。当需要提现时,将最终交易结果写到区块链网络中,被最终确认。可以看到,只有在提现时候才需要通过区块链。
任何一个版本的方案都需要经过双方的签名认证才合法。任何一方在任何时候都可以提出提现,提现需要提供一个双方都签名过的资金分配方案(意味着肯定是某次交易后的结果)。在一定时间内,如果另外一方提出证明表明这个方案其实之前被作废了(非最新的交易结果),则资金罚没给质疑成功方。这就确保了没人会拿一个旧的交易结果来提现。
另外,即使双方都确认了某次提现,首先提出提现一方的资金到账时间要晚于对方,这就鼓励大家尽量都在链外完成交易。
HTLC
微支付通道是通过 Hashed Timelock Contract 来实现的,中文意思是“哈希的带时钟的合约”。这个其实就是限时转账。理解起来其实也很简单,通过智能合约,双方约定转账方先冻结一笔钱,并提供一个哈希值,如果在一定时间内有人能提出一个字符串,使得它哈希后的值跟已知值匹配(实际上意味着转账方授权了接收方来提现),则这笔钱转给接收方。
不太恰当的例子,约定一定时间内,有人知道了某个暗语(可以生成匹配的哈希值),就可以拿到这个指定的资金。
推广一步,甲想转账给丙,丙先发给甲一个哈希值。甲可以先跟乙签订一个合同,如果你在一定时间内能告诉我一个暗语,我就给你多少钱。乙于是跑去跟丙签订一个合同,如果你告诉我那个暗语,我就给你多少钱。丙于是告诉乙暗语,拿到乙的钱,乙又从甲拿到钱。最终达到结果是甲转账给丙。这样甲和丙之间似乎构成了一条完整的虚拟的“支付通道”。
HTLC 的机制可以扩展到多个人,大家可以想象一下,想象出来了就理解了闪电网络。
闪电网络
RSMC 保障了两个人之间的直接交易可以在链下完成,HTLC 保障了任意两个人之间的转账都可以通过一条“支付”通道来完成。整合这两种机制,就可以实现任意两个人之间的交易都可以在链下完成了。
在整个交易中,智能合约起到了中介的重要角色,而区块链则确保最终的交易结果被确认。
现实中的比特币区块链
区块链的分类
根据参与者的不同,可以分为公开(Public)链、联盟(Consortium)链和私有(Private)链。
公开链,顾名思义,任何人都可以参与使用和维护,典型的如比特币区块链,信息是完全公开的。
如果引入许可机制,包括私有链和联盟链两种。
私有链,则是集中管理者进行限制,只能得到内部少数人可以使用,信息不公开。
联盟链则介于两者之间,由若干组织一起合作维护一条区块链,该区块链的使用必须是有权限的管理,相关信息会得到保护,典型如银联组织。
目前来看,公开链将会更多的吸引社区和媒体的眼球,但更多的商业价值应该在联盟链和私有链上。
根据不同的分类,可以看到现在区块链技术的三种典型应用场景:
定位 | 功能 | 一致性 | 权限 | 类型 | 性能 | 代表 |
---|---|---|---|---|---|---|
公信的数字货币 | 记账功能 | PoW | 无 | 公有链 | 较低 | 比特币 |
公信的交易处理 | 智能合约 | PoW、PoS | 无 | 公有链 | 受限 | 以太坊 |
带权限的交易处理 | 商业处理 | 多种,可插拔 | 支持 | 联盟链 | 可扩展 | Hyperledger |
误区
目前,对区块链的认识还存在不少误区。
首先,区块链不是数据库。虽然区块链也可以用来存储数据,但它要解决的问题是多方的互信问题。单纯从存储数据角度,它的效率可能不高,笔者也不推荐把大量的原始数据放到区块链上。
其次,区块链不是要颠覆现有技术。作为基于多项已有技术而出现的新事物,区块链跟现有技术的关系是一脉相承的,在解决多方合作和可信处理上多走了一步,但并不意味着它将彻底颠覆已有的商业模式。很长一段时间里,区块链的适用场景仍需摸索,跟已有系统必然是合作共存的关系。
小结
区块链是第一个试图自带信任化和防止篡改的分布式记录系统。它的出现,让大家意识到,除了互联网这样的尽力而为的基础设施外,我们还能打造一个彼此信任的基础设施。
类似比特币这样的大规模长时间自治运行的系统,也为区块链技术的应用开启了更多遐想的空间。如果人与人之间的交易无法伪造,合同都能确保可靠执行,世界是不是更美好一些了呢?这是技术进步再次给人类发展带来福利。
不提这种去中心化的金融系统是否能在现实中普及,在跨国交易、跨组织合作日益频繁的今天,已经有了不少有意的尝试和参考。
更进一步,比特币只是基于区块链技术的一种金融应用(而且是直接嵌入区块链中),区块链技术还能带来更通用的计算能力。Hyperledger 和 Ethereum 就试图做类似的事情,基于区块链再做一层平台层,让别人基于平台开发应用变得更简单。
另外,区块链本身可以作为分布式存储,也自然可以作为分布式计算引擎。可以想象,整个加入集群的设备都是计算引擎,大家通过付费来使用计算力,是不是就有点普适计算的意味了?
有理由相信,随着更多商业应用场景的出现,区块链技术将在未来金融和信息技术领域占据一席之地。