Redis RDB格式
概览
Header
RDB文件的头部占用9bytes,前5bytes为Magic String,后4bytes为版本号;
52 45 44 49 53 #"REDIS",就像java的class文件以0xCAFEBABE开头一样
30 30 30 36 #RDB版本号,30表示‘0’,版本号为0006=6
注意:版本号是字符串而不是整型;:
snprintf(magic,sizeof(magic),"REDIS%04d",RDB_VERSION);
Body
DB Selector
FE开头表示后跟表示DB Selector;例如:
FE 00#FE表明数据库的哪个db,此处为db0
注意:DB Selector长度不固定,具体的编码方式请参见后文的Length编码
AUX Fields
FA开头表示后跟AUX Fields,记录生成Dump文件的Redis相关信息,例如redis-ver、redis-bits、used-mem、aof-preamble和repl-id等;
这些信息采用String编码;
注意:redis3.0版本的RDB版本号为6,redis3.2的版本号为7;
Key-Value
key-value有三种格式:
-
expire为second
FD $unsigned int #失效时间(秒),4个字节 $value-type #1个字节,表明数据类型:set,map等 $string-encoded-key #key值,字符串类型 $encoded-value #value,编码方式和类型有关
-
expire为millisecond
FC $unsigned long #失效时间(毫秒),8个字节 $value-type #数据类型,1个字节 $string-encoded-key #key,字符串类型 $encoded-value #value,编码方式和类型有关
-
无expire
$value-type #数据类型,1个字节 $string-encoded-key #key,字符串类型 $encoded-value #value,编码方式和类型有关
Footer
FF #RDB文件的结束
8byte checksum #循环冗余校验码,Redis采用crc-64-jones算法,初始值为0
编码算法说明
Length编码
长度采用BigEndian格式存储,为无符号整数
- 如果以"00"开头,那么接下来的6个bit表示长度;
- 如果以“01”开头,那么接下来的14个bit表示长度;
- 如果以"10"开头,该byte的剩余6bit废弃,接着读入4个bytes表示长度(BigEndian);
- 如果以"11"开头,那么接下来的6个bit表示特殊的编码格式,一般用来存储数字:
- 0表示用接下来的1byte表示长度
- 1表示用接下来的2bytes表示长度;
- 2表示用接下来的4bytes表示长度;
String编码
该编码方式首先采用Length编码 进行解析:
- 从上面的Length编码知道,如果以"00","01","10"开头,首先读取长度;然后从接下来的内容中读取指定长度的字符;
- 如果以"11"开头,而且接下来的6个字节为“0”、“1”和“2”,那么直接读取接下来的1,2,4bytes做为字符串的内容(实际上存储的是数字,只不过按照字符串的格式存储);
- 如果以“11”开头,而且接下来的6个字节为"3",表明采用LZF压缩字符串格式:
LZF编码的解析步骤为:
- 首先采用Length编码读取压缩后字符串的长度clen;
- 接着采用Length编码读取压缩前的字符串长度;
- 读取clen长度的字节,并采用lzf算法解压得到原始的字符串
Score编码
- 读取1个字节,如果为255,则返回负无穷;
- 如果为254,返回正无穷;
- 如果为253,返回非数字;
- 否则,将该字节的值做为长度,读取该长度的字节,将结果做为分值;
Value编码
Redis中的value编码包括如下类型:
类型名称 | 类型代码 |
---|---|
String Encoding | 0 |
List Encoding | 1 |
Set Encoding | 2 |
Sorted Set Encoding | 3 |
Hash Encoding | 4 |
Zipmap Encoding | 9 |
Ziplist Encoding | 10 |
Intset Encoding | 11 |
Sorted Set in Ziplist Encoding | 12 |
Hashmap in Ziplist Encoding | 13 |
其中String编码在前面已经介绍过,接下来逐一介绍其他的9种编码方式;
List
- 首先用Length编码读取List的长度lsize;
- 采用String编码读取lsize个字符串
Set
同List
Sorted Set
- 首先用Length编码读取Sorted Set的长度zsize;
- 采用String编码读取字符串,采用Score编码读取分值;
- 循环读取zsize次;
Hash
- 采用Length编码读取Hash的大小hsize;
- 采用String编码读取2*hsize的字符串,按照key,value的方式组装成Map
Zipmap
用于存储hashmap,Redis2.6之后,该编码被废弃,转而采用Ziplist编码;
采用String编码读取整个zipmap字符串,hashmap字符串的格式为:
<zmlen><len>"foo"<len><free>"bar"<len>"hello"<len><free>"world"<zmend>
- zmlen:一个字节,Zipmap的大小;如果>=254,意味着zipmap的大小无法直接获取到,必须要遍历整个zipmap才能得到大小;
- len:字符串长度,1或5个字节长度;如果第一个字节在0~252之间,那么长度为第一个字节;如果为253,那么接下来的4个字节表示长度;254和255是无效值;
- free:1字节,表明value空闲的字节数;
- zmend:0xff,表示Zipmap的结尾;
Ziplist
采用String编码读取整个ziplist字符串,字符串的格式为:
<zlbytes><zltail><zllen><entry><entry><zlend>
- zlbytes:4字节无符号整数,表示ziplist占用的总字节数;
- zltail:4字节无符号整数(little endian),表示尾元素的偏移量;
- zllen:2字节无符号整数(little endian),表示ziplist中的元素个数, 当元素个数大于65535时,无法用2字节表示,需要遍历列表获取元素个数;
- entry:ziplist中的元素;
- zlend:常量(0xff),表示ziplist的结尾;
entry的格式:
<length-prev-entry><encoding><content>
- lenth-prev-entry:如果第一个字节<254,则用1bytes表示长度;否则则用接下来的4bytes(无符号整数)表示长度;
- encoding
- "00"开头:字符串,用接下来的6bit表示长度;
- "01"开头:字符串,用接下来的14bit表示长度;
- "10"开头:字符串,忽略本字节的6bit,用接下来的32bit表示长度;
- "11000000"开头:整数,内容为接下来的16bit;
- "11010000"开头:整数,内容为接下来的32bit;
- "11100000"开头:整数,内容为接下来的64bit;
- "11110000"开头:整数,内容为接下来的24bit;
- "11111110"开头:整数,内容为接下来的8bit;
- "1111"开头 :整数,内容为接下来的4bit的值减去1;
- content
entry内容,它的长度通过前面的encoding确定;
注意:元素长度、内容长度等都是采用Little Endian编码;
Intset
Intset是一个整数组成的二叉树;当set的所有元素都是整形的时候,Redis会采用该编码进行存储;Inset最大可以支持64bit的整数,做为优化,如果整数可以用更少的字节数表示,Redis可能会用16~32bit来表示;注意的是当插入一个长度不一样的整数时,有可能会引起整个存储结构的变化;
由于Intset是一个二叉树,因此它的元素都是排序过的;
采用String编码读取整个intset字符串,字符串的格式为:
<encoding><length-of-contents><contents>
- encoding:32bit的无符号整数;可选值包括2、4和8;表示inset中的每个整数占用的字节数;
- length-of-contents:32bit无符号整数,表示Intset中包含的整数个数;
- contents:整数数组,长度由length-of-contents决定;
Sorted Set in Ziplist Encoding
采用Ziplist编码,区别在于用两个entry分别表示元素和分值;
Hashmap in Ziplist Encoding
采用Ziplist编码,区别在于用两个entry分别表示key和value;
代码样例
代码样例请参考github上的例子redis-sync