Redis 数据类型
Redis 数据类型
前面也提到过,Redis 支持字符串、哈希表、列表、集合、有序集合五种数据类型的存储。了解这五种数据结构非常重要,可以说如果吃透了这五种数据结构,你就掌握了 Redis 应用知识的三分之一,下面我们就来逐一解析。
字符串(string)
string 这种数据结构应该是我们最为常用的。在 Redis 中 string 表示的是一个可变的字节数组,我们初始化字符串的内容、可以拿到字符串的长度,可以获取 string 的子串,可以覆盖 string 的子串内容,可以追加子串。
图 1. Redis 的 string 类型数据结构
图 1. Redis 的 string 类型数据结构如上图所示,在 Redis 中我们初始化一个字符串时,会采用预分配冗余空间的方式来减少内存的频繁分配,如图 1 所示,实际分配的空间 capacity 一般要高于实际字符串长度 len。如果您看过 Java 的 ArrayList 的源码相信会对此种模式很熟悉。
列表(list)
在 Redis 中列表 list 采用的存储结构是双向链表,由此可见其随机定位性能较差,比较适合首位插入删除。像 Java 中的数组一样,Redis 中的列表支持通过下标访问,不同的是 Redis 还为列表提供了一种负下标,-1
表示倒数一个元素,-2
表示倒数第二个数,依此类推。综合列表首尾增删性能优异的特点,通常我们使用 rpush/rpop/lpush/lpop
四条指令将列表作为队列来使用。
图 2. List 类型数据结构
图 2. List 类型数据结构如上图所示,在列表元素较少的情况下会使用一块连续的内存存储,这个结构是 ziplist,也即是压缩列表。它将所有的元素紧挨着一起存储,分配的是一块连续的内存。当数据量比较多的时候才会改成 quicklist。因为普通的链表需要的附加指针空间太大,会比较浪费空间。比如这个列表里存的只是 int 类型的数据,结构上还需要两个额外的指针 prev 和 next。所以 Redis 将链表和 ziplist 结合起来组成了 quicklist。也就是将多个 ziplist 使用双向指针串起来使用。这样既满足了快速的插入删除性能,又不会出现太大的空间冗余。
哈希表(hash)
hash 与 Java 中的 HashMap 差不多,实现上采用二维结构,第一维是数组,第二维是链表。hash 的 key 与 value 都存储在链表中,而数组中存储的则是各个链表的表头。在检索时,首先计算 key 的 hashcode,然后通过 hashcode 定位到链表的表头,再遍历链表得到 value 值。可能您比较好奇为啥要用链表来存储 key 和 value,直接用 key 和 value 一对一存储不就可以了吗?其实是因为有些时候我们无法保证 hashcode 值的唯一,若两个不同的 key 产生了相同的 hashcode,我们需要一个链表在存储两对键值对,这就是所谓的 hash 碰撞。
集合(set)
熟悉 Java 的同学应该知道 HashSet 的内部实现使用的是 HashMap,只不过所有的 value 都指向同一个对象。Redis 的 Set 结构也是一样,它的内部也使用 Hash 结构,所有的 value 都指向同一个内部值。
有序集合(sorted set)
有时也被称作 ZSet,是 Redis 中一个比较特别的数据结构,在有序集合中我们会给每个元素赋予一个权重,其内部元素会按照权重进行排序,我们可以通过命令查询某个范围权重内的元素,这个特性在我们做一个排行榜的功能时可以说非常实用了。其底层的实现使用了两个数据结构, hash 和跳跃列表,hash 的作用就是关联元素 value 和权重 score,保障元素 value 的唯一性,可以通过元素 value 找到相应的 score 值。跳跃列表的目的在于给元素 value 排序,根据 score 的范围获取元素列表。