大数据Java

Redis基本数据类型底层数据结构

2021-12-04  本文已影响0人  Java弟中弟

Redis目前基本的数据类型有String、List、Set、ZSet、Hash五种,首先Redis是C语言开发的,所以底层就是用C语言封装数据结构或者C语言本身提供的数据结构来存储。redis内部的主要数据结构主要有 简单字符串(SDS)、双端链表、字典、压缩列表、跳跃表、整数集合 。Redis内部 并没有直接使用这些数据结构 来实现键值对数据库,而是基于这些数据结构创建了一个对象系统,这个 对象系统 包含了我们所熟知的五种基本类型数据,也就是 字符串对象、列表对象、哈希对象、集合对象和有序集合对象 这五种类型的对象。而它们每一种对象都使用到了至少一种前面所介绍的数据结构。下面介绍一下redis内部的主要几个数据结构 简单字符串(SDS)、双端链表、压缩列表、跳跃表 的定义。然后再介绍一下redis基本的五种数据类型,也就是五种类型的对象用到了上面的哪些数据结构。

redis的数据结构

SDS(Simple Dynamic String)简单字符串

1、redis定义:

Redis基本数据类型底层数据结构

2、使用范围:在redis里面,C本身的字符串只会作为字符串字面量(String literal)只用在一些不必对字符串值修改的地方,比如打印日志。

而redis需要使用字符串存储并且会修改的地方,都使用了SDS来存储。例如Key值。

3、优点:使用SDS来存储字符串的优点:

链表(list)

1、链表:listNode结构来保存,多个listNode可以形成双向链表,redis定义了list表示头节点来持有链表,下图分别是节点listNode和链表list的定义。

2、redis定义:

3、使用范围:链表在redis中用作了列表键、发布与订阅、慢查询、监视器等

跳跃表(zskiplist)

1、跳跃表:是一种有序得数据结构,通过在每个节点上维持多个指向其他节点的指针,从而达到快速访问的目的,可以理解为改进版的双端链表,改进的手段是通过空间换取了时间。

2、复杂度:跳跃表支持平均O(logN)、最坏O(N)的查找复杂度,大部分条件下,跳跃表的效率可以和平衡树媲美,并且实现比平衡树简单。

3、跳跃表结构图:

Redis基本数据类型底层数据结构

仔细观察上图跳跃表的结构后,发现如果节点的层数越高,那么这个节点访问其他节点的速度就越快。换言之,level越高,代表了这个跳跃表的查找效率可能会比较高。当然并不是绝对的,因为redis每次创建跳跃表节点时,程序是根据幂次定律(越大的数出现概率越小), 生成层数高度。同时,节点的顺序是根据每个节点的分值排序的,如果分值相同,那么根据对象的大小排序。

压缩列表(ziplist)

1、压缩列表:是redis为了节省内存而开发的,是由一系列特殊编码的连续内存块组成的顺序型数据结构,一个压缩列表的可以包含多个节点,每个节点可以保存一个字节数组或者一个整数值。

2、压缩列表结构图:

Redis基本数据类型底层数据结构

3、压缩列表特点:

Redis五种基本数据类型

上面提到过,redis并没有使用上面的数据结构直接用来实现键值对数据库,也就是常说的五种基本数据类型,而是创建了一个对象系统,这个系统包含了字符串对象,列表对象、哈希对象、集合对象、和有序集合对象这五种基本数据类型。这样做有一个好处是,我们可以针对不同的场景,对相同的数据类型对象使用不同的数据结构,来优化提高效率。

redisObject对象

1、对象:redis的键值对都是一个redisObject结构,该结构中有三个属性,type类型属性、encoding编码属性、ptr指向底层数据结构属性。

Redis基本数据类型底层数据结构 Redis基本数据类型底层数据结构

2、编码常量:

Redis基本数据类型底层数据结构

String类型

字符串对象的编码是 int、raw、embstr 。参考上面的编码常量表,也就是说字符串类型的数据底层的数据结构使用的是整数、SDS、embstr编码的SDS。

1、编码转换

即上述几种编码会在何时转换,也就是redis底层决定用什么存储字符串数据?。

当int类型的编码通过操作存储的是字符串值,那么字符串对象的编码将从int变为raw。

List类型

列表对象的编码可以是 zipList压缩列表linkedlist双端链表

1、编码转换

即上述两种编码会在何时转换,也就是redis底层什么时候会用压缩列表存储列表数据?什么时候会使用双端链表存储列表数据。

当列表同时满足以下两个条件时,列表对象会使用zipList编码,也就是压缩列表

2、配置

上述两个条件是支持配置的,也就是说我们可以redis直接读取我们的配置,来决定列表list类型底层使用什么样的数据结构来存储数据

Set类型

集合对象使用的是 intset整数集合 (intset底层使用的是整数集合数据结构)或者 hashtable哈希表 (hashtable底层使用的是字典数据结构,我们并没有在本文做详细介绍,有需要可以自己了解)

1、编码转换

当集合对象同时满足下面两个条件,会使用intset编码

2、配置

上述第二个条件是支持配置的。

ZSet类型

有序集合的编码使用的是 ziplist压缩列表skiplist跳跃表

注意:上面介绍skiplist的时候我们可以从结构图中明显看到存储集合元素的时候,score在每个节点中式如何存储的。那么如果ZSet使用的式ziplist压缩列表,redis怎么存储score和value值呢?其实很简单,每个集合的元素都使用两个节点来存储,第一个节点保存的是成员(member),第二个元素保存的是元素的分值(score)

1、编码转换

当有序集合对象可以同时满足以下两个条件时,使用ziplist编码

2、配置

上述两个条件是支持配置的。

Hash类型

哈希对象使用的是 ziplist压缩列表hashtable哈希表 。(hashtable底层使用的是字典数据结构,我们并没有在本文做详细介绍,有需要可以自己了解)

1、编码转换

当哈希对象同时满足下面两个条件,使用ziplist压缩列表

2、配置

上述两个条件是支持配置的。

上一篇 下一篇

猜你喜欢

热点阅读