搞懂Redis(二)-5:Zset数据结构
Zset有序集合和set相同在于成员不重复. 不同的是,有序集合的元素是可以排序的.但是它和列表使用的索引下标作为排序依据不同,它给每个元素设置一个分数,作为排序依据.
Zset底层数据结构:zipList和skipList
Zset也使用zipList做了排序.
zipList排序:
每个集合元素使用两个紧挨在一起的压缩列表节点来保存,第一个节点保存元素的成员(member),第二个保存元素的分值(score)
结构图如下:
zipList压缩结构
skipList跳表
与dict结合使用,结构较复杂
/*
* 跳跃表
*/
typedef struct zskiplist {
// 头节点,尾节点
struct zskiplistNode *header, *tail;
// 节点数量
unsigned long length;
// 目前表内节点的最大层数
int level;
} zskiplist;
/*
* 跳跃表节点
*/
typedef struct zskiplistNode {
// member 对象
robj *obj;
// 分值
double score;
// 后退指针
struct zskiplistNode *backward;
// 层
struct zskiplistLevel {
// 前进指针
struct zskiplistNode *forward;
// 这个层跨越的节点数量
unsigned int span;
} level[];
} zskiplistNode;
什么是跳表?
我们先看下链表
链表结构图
如果要查找到node5,需要从node1查到node5,查询耗时.
如果在node上加上索引:
加索引的链表结构
这样通过索引就能直接从node1查找到node5
Redis跳跃表
Redis的跳表结构
Redis的跳表结构
- header:指向跳跃表的表头节点,通过这个指针程序定位表头节点的时间复杂度就是O(1)
- tail:指向跳跃表的表尾节点,通过这个指针程序定位表尾节点的时间复杂度为O(1)
- level:记录在目前的跳跃表内,层数最大的那个节点的层数(表头节点的层数不计算在内),通过这个属性可以再回到O(1)的时间复杂度内获取层高最好的节点的层数
- length 记录跳跃表的长度,就是跳跃表目前包含节点的数量(表头节点不算在内),通过这个属性,程序可以再O(1)的时间复杂度内返回跳跃表的长度
右侧是4个zskiplistNode结构,包含以下属性
-
层(level)
节点中用L1、L2、L3等字样标记节点的各个层,L1代表第一层,L2代表第二层,以此类推。
每个层都带有两个属性:前进指针和跨度。前进指针用于访问位于表尾方向的其他节点,而跨度则记录了前进指针所指向节点和当前节点的距离(跨度越大、距离越远)。在上图中,连线上带有数字的箭头就代表前进指针,而那个数字就是跨度。当程序从表头向表尾进行遍历时,访问会沿着层的前进指针进行。
每次创建一个新跳跃表节点的时候,程序都根据幂次定律(powerlaw,越大的数出现的概率越小)随机生成一个介于1和32之间的值作为level数组的大小,这个大小就是层的“高度”。 -
后退(backward)指针:
节点中用BW字样标记节点的后退指针,它指向位于当前节点的前一个节点。后退指针在程序从表尾向表头遍历时使用。与前进指针所不同的是每个节点只有一个后退指针,因此每次只能后退一个节点。 -
分值(score):
各个节点中的1.0、2.0和3.0是节点所保存的分值。在跳跃表中,节点按各自所保存的分值从小到大排列。 -
成员对象(oj):
各个节点中的o1、o2和o3是节点所保存的成员对象。在同一个跳跃表中,各个节点保存的成员对象必须是唯一的,但是多个节点保存的分值却可以是相同的:分值相同的节点将按照成员对象在字典序中的大小来进行排序,成员对象较小的节点会排在前面(靠近表头的方向),而成员对象较大的节点则会排在后面(靠近表尾的方向)。