分布式存储

LevelDB 完全解析(3):SSTable

2020-05-05  本文已影响0人  linjinhe

前文回顾

SSTable 全称 Sorted String Table,顾名思义,里面的 key-value 都是有序保存的。除了两个 MemTable,LevelDB 中的大部分数据是以 SSTable 的形式保存在外存上。

SSTable 由 compaction 生成:

SSTable 的格式

SSTable 格式

在一个 SSTable 中,文件末尾的 Footer 是定长的,其他数据都被划分成一个个变长的 block:index block、metaindex block、meta blocks、data blocks。

Block

Index blockmeta index blockdata block 都是通过 BlockBuilder 来生成,通过 Block 来读取的。最简单的方式,block 里面只需要将一个个 key-value 有序保存。但是为了节省空间,LevelDB 在 block 的内部实现了前缀压缩

前缀压缩利用了 key 的有序性(前缀相同的有序 key 会聚集在一起)对 key 进行压缩,每个 key 与前一个 key 相同的前缀部分可以不用保存。读取的时候再根据规则进行解码即可。

LevelDB 将 block 的一个 key-value 称为一条 entry。每条 entry 的格式如下:

entry 格式

一个 block 的数据格式如下:

block 格式

在 block 中查找一个 key(Block::Iter::Seek):

  1. 先在 restarts 数组的基础上进行二分查找,确定 restart point。
  2. 从 restart point 开始遍历查找

Filter

Meta block(bloom filter)由 FilterBlockBuilder 来生成,通过 FilterBlockReader 来读取。

后面会单独写一篇介绍 filter。

上一篇 下一篇

猜你喜欢

热点阅读