Java技术升华@IT·互联网我爱编程

Redis学习笔记:数据类型的内部编码与单线程架构

2018-07-24  本文已影响97人  Vechace

前言:最近实习工作比较忙,业余时间在看付磊的《Redis开发与运维》,并结合以前的学习总结,整理这一系列学习笔记,希望小伙伴能有所收益,感谢阅读~

一、数据类型与内部编码

Redis提供了五种数据结构,分别是:String(字符串)、hash(哈希)、list(列表)、set(集合)、zset(有序集合),其数据类型及其内部编码如下图:

Redis数据结构.png

从图中可以看到,每种数据结构其底层实现都有2种或3种编码实现,这样设计有以下好处:

二、单线程架构

1、线程模型:

Redis线程模型采用的是单线程架构,并使用I/O多路复用模型来共同实现高性能的内存数据库服务;Redis客户端与服务端的模型可以简化为下图:

redis请求过程.png

Redis客户端与服务端通过RPC通信,其内部设计了一套专用的文本通讯协议 RESP:Redis Serialization Protoco;Redis客户端调用都会经历发送命令、执行命令、返回结果三个过程;其中第二步是需要重点关注的。

Redis采用单线程来处理命令,所以一条命令从客户端发送到服务端不会立即被执行,所以的命令都会进入一个队列(单线程的特性)中,然后逐个被执行;因此,如果多个客户端同执行命令时,其命令的执行顺序是不确定的,但可以确定的是不会有两天命令被同时执行,因此不存在并发问题(线程不安全问题)。

2、I/O多路复用模型

通常来说,单线程的处理能力要比多线程差,那么为什么单线程的Redis仍然可以那么快呢?可以归结为以下几点:

多路复用模型.png

3、总结

单线程能带来以下好处:

单线程存在的问题:对于每个命令的执行时间是有要求的。如果执行时间过长,则会造成其他命令的阻塞,对于Redis的高性能服务来说这是致命的问题,因此Redis是面向快速执行场景的数据库。

三、Redis底层实现

根据以上知识可以继续深入理解Redis的底层实现,总结如下:

1、Redis的线程结构:

1)、I/O业务单线程:

Redis的单线程结构是指其主线程是单线程的,包括I/O时间的处理,以及I/O对应的相关请求的业务处理,此外主线程还负责过期键的处理、复制协调、集群协调等等,这些除了I/O事件(内存数据库无IO事件)之外的逻辑会被封装成周期性任务由主线程周期性地处理。因为单线程的设计,对于客户端的所有读写请求,都由一个主线程串行处理,不存在并发问题,避免了频繁的上下文切换和锁竞争,且在网络上使用epoll,利用epool的非阻塞多路复用特性,不需要在IO上付出代价

2)、异步化组件:

RDB文件、持久化AOF文件等操作不放在主线程里面处理,Redis会在适当时候fork子进程来异步处理这些任务,其线程体系结构如下:

线程体系.png

main eventloop:主线程
child process:子进程,用于处理RDB持久化及AOF持久化等任务
job thread :异步任务处理线程:BIO组件

BIO组件:在Redis中,异步任务处理线程组被封装在BIO组件中,源文件为bio.h和bio.c。bio异步线程启动时在main方法调用,会生成BIO_NUM_OPS(3)个线程,线程函数为bioProcessBackgroundJobs。BIO线程包括三个线程,分别处理三类任务文件句柄关闭任务:

  1. 文件句柄的释放(close)对于操作系统来说是一个比较重的操作,在Redis中,当需要重新创建新的文件句柄,废弃的文件句柄失效的时候,这个废弃的文件句柄将由异步任务处理线程来关闭。

  2. AOF持久化任务:Redis对于AOF文件的持久化有三种策略

    1. 关闭AOF功能
    2. aof_fsync_everysec策略,即每秒一次,实际上并不是一定一秒钟一次
    3. aof_fsync_always策略,即每次IO事件处理完毕,都将AOF持久化

这三种策略分别对应不同的业务场景和用户需求,默认的策略为aof_fsync_everysec,这个时候对于aof缓冲区内容持久化工作会交给异 步任 务处理线程来处理

  1. 内存的释放:释放的空间包括:

    1. 对象空间的释放
    2. DB空间的异步释放
    3. slots-leys空间释

3、redis阻塞原因:

内因:
不合理使用API和数据结构

CPU饱和持久化阻塞:fork阻塞、AOF刷盘阻塞、HugePage写操作阻塞

外因:CPU竞争、内存交换、网络问题

四、应用场景分析比较

应用场景分析:Hash、LSM、B+树实际应用开发中,根据需求的不同进行数据存储技术的选型,常见的存储实现有redis、mysql、Hbase,其底层实现的数据结构分别是:hash、B+树、LSM树,各自的特性如下:

参考资料:


1、《Redis开发与运维》付磊、张益军[著]

2、个人学习总结

上一篇 下一篇

猜你喜欢

热点阅读