Redis(五) -- 数据存储
本文主要参考redis各类型数据存储分析,Redis-基本数据类型与内部存储结构
背景
我们在之前的文章中介绍了Redis主要有五种数据结构,分别是String、Hash、List、Set、Sorted Set,并且大致说了下各自底层的数据结构,这一篇就好好学习下这五种数据结构的存储。
Redis存储对象
Redis使用dictEntry对象来存储一个k-v值,我们来看下dictEntry的三个属性值
- key:redis的key是以SDS(简单动态字符串)存储。
-
val:reids的val是以redisObject对象存储,redisObject里面包含多个属性,最重要的是type和encoding,type表示value对象是何种数据类型,encoding表示不同数据类型在redis内部的存储方式。
Redis的内存分配器默认是jemalloc,可以将内存空间划分为小,大,巨大三个范围,每个范围又划分了许多小的内存块单位,当Redis存储数据的时候会选择最合适的内存块进行存储。
String
字符串对象的底层可以是int,raw,embstr。
- int:8个字节的长整数,在一定条件下会转化为raw编码字符串对象。
- raw:大于39个字节的字符串,简单动态字符串(SDS),有点类似于List<String>,长度动态可变
struct sdshdr {
// buf 中已占用空间的长度
int len;
// buf 中剩余可用空间的长度
int free;
// 数据空间
char buf[]; // ’\0’空字符结尾
};
- embstr:小于等于39个字节的字符串,在一定条件下也会转化成raw编码字符串对象,通过调用一次内存分配函数来分配一块连续的空间。
String的常用命令的时间复杂度为O(1),读写一样快,当遇到Incr,decr等操作时会转成数据型进行计算。
List
List对象的底层是quicklist,由ziplist和linkedlist组成的快速列表,所以list支持两端插入和弹出,lpush,rpush,lpop,rpop等命令。可以获得指定位置(或范围)的元素,可以充当数组、队列、栈等。
typedef struct listNode {
// 前置节点
struct listNode *prev;
// 后置节点
struct listNode *next;
// 节点的值
void *value;
} listNode;
typedef struct list {
// 表头节点
listNode *head;
// 表尾节点
listNode *tail;
// 节点值复制函数
void *(*dup)(void *ptr);
// 节点值释放函数
void (*free)(void *ptr);
// 节点值对比函数
int (*match)(void *ptr, void *key);
// 链表所包含的节点数量
unsigned long len;
} list;
- linkedlist:结构有点类似java的linkedlist,列表在增删操作时时间复杂度较低。
- ziplist:当一个列表键只包含少量列表项,且是小整数值或长度比较短的字符串时,redis会用ziplist代替linkedlist,可以节省内存空间,但是增删时复杂度较高。
-
quickList: zipList 和 linkedList 的混合体。它将 linkedList 按段切分,每一段使用 zipList 来紧凑存储,多个 zipList 之间使用双向指针串接起来。因为链表的附加空间相对太高,prev 和 next 指针就要占去 16 个字节 (64bit 系统的指针是 8 个字节),另外每个节点的内存都是单独分配,会加剧内存的碎片化,影响内存管理效率。
Hash
Hash对象底层实现是ziplist或者hashtable,当Hash对象满足hash元素数量小于512个并且所有键值对的键和值字符串长度都小于64字节时会使用ziplist,否则使用hashtable.
-
hashtable:hashtable有点类似java中hashmap,当产生哈希冲突时使用链地址法来解决键冲突。
Set
Set的底层实现是intset或者hashtable
- intset:当一个集合只含有整数,并且元素不多时会使用intset存储,是一个无序set。
typedef struct intset {
// 编码方式
uint32_t encoding;
// 集合包含的元素数量
uint32_t length;
// 保存元素的数组
int8_t contents[];
} intset;
Sorted Set
Sorted Set也叫ZSet,底层实现使用ziplist或者skiplist。
- skiplist:跳跃表是很常见的一个提高查询时间复杂度的结构,可以将平均时间复杂度降到logN,譬如在lucene索引中也使用到,当ZSet元素数量比较多或者成员是比较长的字符串时会使用skiplist作为底层实现。
typedef struct zskiplist {
// 表头节点和表尾节点
struct zskiplistNode *header, *tail;
// 表中节点的数量
unsigned long length;
// 表中层数最大的节点的层数
int level;
} zskiplist;
typedef struct zskiplistNode {
// 成员对象
robj *obj;
// 分值
double score;
// 后退指针
struct zskiplistNode *backward;
// 层
struct zskiplistLevel {
// 前进指针
struct zskiplistNode *forward;
// 跨度---前进指针所指向节点与当前节点的距离
unsigned int span;
} level[];
} zskiplistNode;