redis为啥这么快？

2022-01-07 本文已影响0人后厂村村长

提到当前主流的 NoSql，那一定非 Redis 莫属。
因为它读写速度极快，应用广泛，以至于，面试如果不提一下redis，都不好意思说自己面试过或者被面过。

上至初出茅庐应届生，下至十年IT界老狗，都得过redis这一关。

那么，问题来了，redis，它为什么这么快呢？

除了常见的八股文知识点，很多人好像并没有做深入了解，这就诞生了一个问题：
如果只是粗浅一问，兴许就蒙混过去了；如果稍微深入探讨，直接就ICU了，抢救都不知道咋抢救。

现在，

就让我们一起（稍微的）深入了解下 redis 运行这么快的原因吧！

单机的 redis 就可以支撑每秒 10 几万的并发，相对于 mysql 来说，性能是 mysql 的几十倍。其速度快的原因主要有以下几点：

1、采用高效的优化过的数据结构（C语言实现），在几种基础的数据结构上，redis 做了大量优化，性能极高；
2、完全基于内存操作；
3、单线程运行^[1]，省去了上下文切换成本；
4、使用非阻塞的 IO 多路复用机制；
5、惰性删除机制；

接下来针对以上几点，做个详尽剖析。

1、何谓高效的数据结构？

Redis 的底层数据结构一共有6种，分别为：简单动态字符串(SDS)，双向链表，压缩列表，哈希表，跳表和整数数组；
它们和数据类型的对应关系如下图：

对应关系.png

简单动态字符串SDS：

redis 没有直接使用传统的 C 语言字符串类型，而是自己实现了一种叫做简单动态字符串 SDS 的抽象字符串类型。
C 语言的字符串并不会记录自身的长度信息，而 SDS 则保存了长度信息，这样就将获取字符串长度的时间复杂度由 O(N) 降低到了 O(1)，同时减少了修改字符串长度时所需的内存重分配次数。

双向链表 linkedlist：

redis 链表是一个双向无环链表结构，许多功能都采用链表来实现，如：发布、订阅、慢查询、监视器等；每个链表的节点由一个 listNode 结构来表示，每个节点都有指向前置节点和后置节点的指针，同时表头节点的前置和后置节点均指向 NULL。

哈希表 hashtable：

用于保存键值对数据的的抽象结构。redis 使用 hash 表作为底层实现，每个字典带有两个 hash 表，供平时使用和 rehash；
hash 表使用链地址法来解决键冲突，被分配到同一个索引位置的多个键值对会形成一个单向链表，在对 hash 表进行扩容或者缩容的时候，为了服务可用性，rehash 过程不是一次性完成的，而是渐进式的。

跳跃表 skiplist：

跳跃表是有序集合的底层实现之一，redis 中在实现有序集合键和集群节点的内部结构中都用到了跳跃表。
redis 跳跃表由 zskiplist 和 zskiplistNode 组成。
zskiplist 用于保存跳跃表信息（表头、表尾节点、长度等）；
zskiplistNode 用于表示表跳跃节点，每个跳跃表的层高都是 1-32 的随机数；
在同一个跳跃表中，多个节点可以包含相同分值，但是每个节点的成员对象必须是唯一的，节点按照分值大小排序，如果分值相同，则按照成员对象的大小排序。

整数数组 intset：

用于保存整数值的集合抽象数据结构，不会出现重复元素，底层实现为数组。

压缩列表 ziplist：

压缩列表是为了节约内存而开发的【顺序性】数据结构，可以包含多个节点，每个节点可以保存一个字节数组或整数值。

基于以上6种基础数据结构，redis 封装了自己的对象系统，包含字符串对象 string、列表对象 list、哈希对象 hash、集合对象 set、有序集合对象 zset等，每种对象都用到了至少一种基础数据结构。

关于 Redis 的底层数据结构，其实单开一篇文章都讲不完，所以这里只是简单说明一下，后续会根据每种类型单独开讲。

待续……

注：redis6.0 之后其实已经改用多线程了，但并非是完全摒弃单线程，redis 依然使用单线程模型来处理客户端请求，只是使用多线程来处理数据的读写和协议解析。
这样做的目的是因为 redis 的性能瓶颈在于网络 IO 而非 CPU，使用多线程能提升 IO 读写的效率，从而整体提高 redis 的性能。 ↩

redis为啥这么快？

现在，

1、何谓高效的数据结构？

猜你喜欢

热点阅读