[以太坊源码分析]:RLP编码
2019-02-09 本文已影响0人
jea的笔记本
RLP编码
RLP编码是以太坊对象序列化和反序列化的主要方法,可编码任意嵌套的二进制数据。以太坊中多个地方都用到了RLP编码,例如区块,交易等。
RLP是 Recursive Length Prefix 三个单词的缩写,分别是递归,长度,前缀。以下是我的理解:递归指可以处理嵌套的数据结构,长度指编码是对数据的长度进行处理,前缀指编码结果是在数据前加一个前缀。
0.索引
01.为什么要使用RLP编码
02.RLP编码规则
03.总结
1.为什么要使用RLP编码
使用RLP编码的情况下,需要保存的额外数据比较少。RLP编码结果的前缀不会超过9个字节,举个例子:
type Tests struct{
Name string
}
t := Tests{Name:"abc"}
- 1.采用JSON编码,
t
的编码结果为{"Name":"abc"}
,长度为14个字节。 - 2.采用RLP编码,
t
的编码结果为0x83616263
,直观的表示为131 a b c
,长度为4个字节。
t
的有效的数据长度为3个字节,采用JSON编码的时候,额外的数据长度为11个字节,而采用RLP编码的时候,额外的数据长度为1个字节(即前缀)。由此可见,RLP编码可以节省编码后的数据的存储空间,这对以太坊来说是很必要的,区块和交易编码后的长度跟原来的长度相差不大,节省了存储空间的开销。
2.RLP编码规则
在以太坊的黄皮书附录B中,定义了如下的两种数据结构:
简单的理解为,L为列表类型的数据,B为字节数组,字符串类型的数据。如果是其他的数据类型,则需要先转换为这两种数据类型,比如说,结构体转换为嵌套的列表,布尔类型转换为整型。对此两种数据类型的RLP编码表示为:
RLP编码的规则一共有5个,3个对于字节数组而言,剩下2个与列表有关。
字节数组
字节数组的编码过程Rb(x)涉及了3个规则:
- 1.单个字节,小于128,结果为该字节
- 2.字节数组,长度小于56,结果为128+字节数组长度,各个字节的编码两部分
- 3.字节数组,长度大于等于56,结果为183+字节数组长度编码的长度,字节数组长度,各个字节的编码三部分 (长度不能超过288)
举个例子:
- 1.单个字节:z => “7A”
(z的十六进制ascii码为7A) - 2.长度小于56的字节数组:xyz => “8378797A”
(83为128+3的十六进制表示,xyz分别为78 79 7A) - 3.长度大于等于56的字节数组:“Lorem ipsum dolor sit amet, consectetur adipisicing elit” =>“B8384C6F72656D20697073756D20646F6C6F722073697420616D65742C20636F6E7365637465747572206164697069736963696E6720656C6974”
(B8为183+1,1为字节数组长度56的编码长度;38为字节数组长度56十六进制;其余为各个字节的编码)
BE(x),去掉前导零的大端表示 (bn是8个字节的,所以以8个字节为例)
例如:1024 -> 0x00 00 00 00 00 00 04 00 -> 0x0400
(a)·(b,c)·(d,e) = (a,b,c,d,e),指的是字节的拼接,类似于把字符串连接起来。
列表
列表的编码过程Rl(x)涉及了2个规则:
- 1.列表,长度小于56,结果为192+列表长度,各个字节的编码两部分
- 2.列表,长度大于等于56,结果为247+列表长度编码的长度,列表长度,各个子列表的编码三部分
举个例子:
- 1.长度小于56的列表:[ 1, 2, 3] => “C3010203”
(C3为192+3的十六进制表示) - 2.长度大于等于56的列表:["aaa", "bbb", "ccc", "ddd", "eee", "fff", "ggg", "hhh", "iii", "jjj", "kkk", "lll", "mmm", "nnn", "ooo“] =>“F83C836161618362626283636363836464648365656583666666836767678368686883696969836A6A6A836B6B6B836C6C6C836D6D6D836E6E6E836F6F6F”
(F8为247+1,1为总的列表长度60的编码长度;3C为60十六进制表示;bbb为一个子列表83626262,80+3,以及b为62)
3.总结
- 1.RLP编码是以太坊对象序列化和反序列化的主要方法,对数据进行编码,编码结果为在原本的数据前增加一个前缀。可节省编码后的数据的存储空间。
- 2.RLP编码有5个规则,3个规则适用于字节数组,2个规则适用于列表。根据字节数组和列表的不同长度使用不同的编码规则。