Sawtooth Lake学习笔记(三)
第三章 架构概览
一、全局状态
像锯齿湖这样的分布式总账的设计初衷之一就是在各参与节点之间分布式存储账本。通过拜占庭共识来保证各节点之间的数据副本一致性能力是区块链技术的核心优势之一。
锯齿湖在每一个验证者上的一个基数-默克尔树实例上体现所有交易家族的状态信息。在每一个验证组件上的区块验证处理将保证同样的处理得到同样的状态转换结果,而且所有网络上的参与者得到的结果数据也是一样的。状态被切分成多个命名空间,这些命名空间允许交易家族的制定者去自由地设计、共享和重复利用交易处理器之间的全局状态数据。
1. 基数-默克尔树概览
1.1 默克尔哈希
锯齿湖使用一个可定址的基数-默克尔树来存储交易家族的数据。我们来详细解释一下。默克尔树具有即写即拷贝的数据结构,该结构可以存储树上任何变化导致的从叶节点到根节点的连续节点哈希。对于一系列与区块有关的特定状态转换,我们可以单独生成一个指向树上这个版本的根哈希。通过把这个状态根哈希放进区块头,我们在对区块的链的共识之外,还可以获得对特定状态版本的共识。如果一个验证组件对某个区块的状态转换导致不同的哈希,这个区块将被视为无效。
默克尔树的所有节点的值都是哈希值,每个哈希值是根据其子节点的哈希值计算出来的,所以任何一个节点和哈希值出现变化,它的上层节点的哈希值都会跟着变。
1.2 基数地址
在存储信息的基数树上,任意一个叶子节点的路径和地址具有唯一对应关系。一个地址由70个16进制字符(即35个字节)组成,如下图:
在树的实施使用上,每一个字节是一个基数路径部分,它指向通往存有与地址相关数据所在叶子的路径的下一个节点。地址格式包括一个3个字节(6个16进制字符)的命名空间前缀,在一个给定的锯齿湖实例里,它可以提供2的24次方(16,777,216)的可用的不同命名空间。地址格式里余下的32个字节(64个16进制字符)可以被命名空间的设计制定者来使用,包括进一步细分的方案,区分对象的类型,将特定域内的特有身份映射到地址部分。
基数-默克尔树架构图:
Sawtooth 采用Radix Merkle Tree 结构做数据存储的好处就是给定区块名及类别,直接计算哈希值,就可以找到它的存储位置。而且每个交易家族的存储空间都是隔离开的,互不影响。所以,从存储结构来看,基于Sawtooth 的区块链天生是多链的,很容易去追踪它的分叉。
2 序列化考虑
除了地址编译的问题,命名空间的设计制定者还需要定义地址中存储数据的序列化和非序列化的规则,以及序列化机制。特定域内的交易处理器采用get(地址)和set(地址,数据)来调用验证组件提供的一个状态版本。get(地址)返回地址中的字节数组,set(地址,数据)设置地址中存储的字节数组。字节数组在核心系统中是不可见的。它只有当被特定域内的组件基于命名空间规则来反序列化后才具有意义。选择一个序列化方案非常关键,它是跨交易执行、跨平台、跨序列化框架版本的关键因素。不强制要求序列有序化的数据结构(例如,集合、映射、字典)都应避免使用。要能在在时间和空间上连贯产生字节数组。如果不能产生相同的字节数组,叶子节点的哈希所包含的数据就会不同,同样每一个父节点(一直上追到根节点)也都会不同。这会导致某些交易和所在区块,在不确定的行为下,被部分验证组件认为是有效的,而被其他组件认为是无效的。以上这种是不好的形式。