redis为啥这么快?
提到当前主流的 NoSql,那一定非 Redis 莫属。
因为它读写速度极快,应用广泛,以至于,面试如果不提一下redis,都不好意思说自己面试过或者被面过。
上至初出茅庐应届生,下至十年IT界老狗,都得过redis这一关。
那么,问题来了,redis,它为什么这么快呢?
除了常见的八股文知识点,很多人好像并没有做深入了解,这就诞生了一个问题:
如果只是粗浅一问,兴许就蒙混过去了;如果稍微深入探讨,直接就ICU了,抢救都不知道咋抢救。
现在,
就让我们一起(稍微的)深入了解下 redis 运行这么快的原因吧!
单机的 redis 就可以支撑每秒 10 几万的并发,相对于 mysql 来说,性能是 mysql 的几十倍。其速度快的原因主要有以下几点:
1、采用高效的优化过的数据结构(C语言实现),在几种基础的数据结构上,redis 做了大量优化,性能极高;
2、完全基于内存操作;
3、单线程运行[1],省去了上下文切换成本;
4、使用非阻塞的 IO 多路复用机制;
5、惰性删除机制;
接下来针对以上几点,做个详尽剖析。
1、何谓高效的数据结构?
Redis 的底层数据结构一共有6种,分别为:简单动态字符串(SDS),双向链表,压缩列表,哈希表,跳表和整数数组;
它们和数据类型的对应关系如下图:
对应关系.png
简单动态字符串SDS:
redis 没有直接使用传统的 C 语言字符串类型,而是自己实现了一种叫做简单动态字符串 SDS 的抽象字符串类型。
C 语言的字符串并不会记录自身的长度信息,而 SDS 则保存了长度信息,这样就将获取字符串长度的时间复杂度由 O(N) 降低到了 O(1),同时减少了修改字符串长度时所需的内存重分配次数。
双向链表 linkedlist:
redis 链表是一个双向无环链表结构,许多功能都采用链表来实现,如:发布、订阅、慢查询、监视器等;每个链表的节点由一个 listNode 结构来表示,每个节点都有指向前置节点和后置节点的指针,同时表头节点的前置和后置节点均指向 NULL。
哈希表 hashtable:
用于保存键值对数据的的抽象结构。redis 使用 hash 表作为底层实现,每个字典带有两个 hash 表,供平时使用和 rehash;
hash 表使用链地址法来解决键冲突,被分配到同一个索引位置的多个键值对会形成一个单向链表,在对 hash 表进行扩容或者缩容的时候,为了服务可用性,rehash 过程不是一次性完成的,而是渐进式的。
跳跃表 skiplist:
跳跃表是有序集合的底层实现之一,redis 中在实现有序集合键和集群节点的内部结构中都用到了跳跃表。
redis 跳跃表由 zskiplist 和 zskiplistNode 组成。
zskiplist 用于保存跳跃表信息(表头、表尾节点、长度等);
zskiplistNode 用于表示表跳跃节点,每个跳跃表的层高都是 1-32 的随机数;
在同一个跳跃表中,多个节点可以包含相同分值,但是每个节点的成员对象必须是唯一的,节点按照分值大小排序,如果分值相同,则按照成员对象的大小排序。
整数数组 intset:
用于保存整数值的集合抽象数据结构,不会出现重复元素,底层实现为数组。
压缩列表 ziplist:
压缩列表是为了节约内存而开发的【顺序性】数据结构,可以包含多个节点,每个节点可以保存一个字节数组或整数值。
基于以上6种基础数据结构,redis 封装了自己的对象系统,包含字符串对象 string、列表对象 list、哈希对象 hash、集合对象 set、有序集合对象 zset等,每种对象都用到了至少一种基础数据结构。
关于 Redis 的底层数据结构,其实单开一篇文章都讲不完,所以这里只是简单说明一下,后续会根据每种类型单独开讲。
待续……
-
注:redis6.0 之后其实已经改用多线程了,但并非是完全摒弃单线程,redis 依然使用单线程模型来处理客户端请求,只是使用多线程来处理数据的读写和协议解析。
这样做的目的是因为 redis 的性能瓶颈在于网络 IO 而非 CPU,使用多线程能提升 IO 读写的效率,从而整体提高 redis 的性能。 ↩