程序员javaweb收藏架构算法设计模式和编程理论

Redis内存管理和持久化机制

2017-02-17  本文已影响951人  locoder

内存管理

Redis是一个基于内存的key-value的数据库,其内存管理是非常重要的;其针对不同操作系统的差异,同时方便自己实现相关的统计函数,封装了不同平台的实现,具体可参阅深入redis内部--内存管理

Redis支持多种不同的数据类型,如下:

下面就详细来介绍下其数据结构和编码。

数据结构

所有的Redis对象都被封装在RedisObject这个结构体当中,如下:

typedef struct redisObject {
    unsigned type,           // 4字节,数据类型(String,List,Set,Hash,Sorted Set)
    unsigned encoding,   // 4字节,编码方式
    unsigned lru,              // 24字节
    int refcount,               // 对象引用计数
    void *ptr                    // 数据具体存储的指向
} robj;

数据类型的常用编码方式如下:

数据类型 常用 少量数据 特殊情况
String RAW EMBSTR INT O(1) O(1)
List LinkedList ZipList pop:O(1)
lset:O(N)
push:O(1)
lindex:O(N)
Set Hash Table INTSET(少量整数) O(1) O(1)
Hash Hash Table ZipList O(1) O(1)
Sorted Set SkipList ZipList zscore:O(1)
zrank:O(logN)
O(logN)

编码方式介绍:

过期机制

Redis为了不影响正常的读写操作,一般只会在必要或CPU空闲的时候做过期清理的动作;

  1. 必要:一次事件循环结束,进入事件侦听前
  2. CPU空闲:系统空闲时做后台定时清理任务(时间限制为25%的CPU时间);Redis后台清理任务默认100ms执行1次,25%限制是表示25ms用来执行key清理

过期key清理算法:

  1. 依次遍历所有db;
  2. 从db中随机取得20个key,判断是否过期,若过期,则剔除;
  3. 若有5个以上的key的过期,则重复步骤2,否则遍历下一个db
  4. 清理过程中若达到了时间限制,则退出清理过程

持久化

Redis支持四种持久化方式;如下:

前两种方式为小数据量追加落地方式;后两种为尝试存储数据超过物理内存时,一次性落地方式;

定时快照方式(snapshot)

该方式实际是在Redis内部执行一个定时任务,根据redis.conf中配置的save的时间间隔去检查当前数据改变次数和时间是否满足配置,如果满足则从父进程fork(copy-on-write机制)出一个子进程,通过该子进程遍历内存来转换成rdb文件;

# Save the DB on disk:
# 设置sedis进行数据库镜像的频率。
# 900秒(15分钟)内至少1个key值改变(则进行数据库保存--持久化)。
# 300秒(5分钟)内至少10个key值改变(则进行数据库保存--持久化)。
# 60秒(1分钟)内至少10000个key值改变(则进行数据库保存--持久化)。
save 900 1
save 300 10
save 60 10000
 
stop-writes-on-bgsave-error yes

# 在进行镜像备份时,是否进行压缩。yes:压缩,但是需要一些cpu的消耗。no:不压缩,需要更多的磁盘空间。
rdbcompression yes
# 一个CRC64的校验就被放在了文件末尾,当存储或者加载rbd文件的时候会有一个10%左右的性能下降,为了达到性能的最大化,你可以关掉这个配置项。
rdbchecksum yes
# 快照的文件名
dbfilename dump.rdb
# 存放快照的目录
dir /var/lib/redis 

缺陷:快照只是一段时间的数据的体现,若发生宕机,数据会丢失

基于语句追加文件的方式(aof)

类似mysql的binlog方式,每个数据发生改变都会追加至一个log文件中;

# 是否开启AOF,默认关闭(no)
appendonly yes
# 指定 AOF 文件名
appendfilename appendonly.aof
# Redis支持三种不同的刷写模式:
# appendfsync always #每次收到写命令就立即强制写入磁盘,是最有保证的完全的持久化,但速度也是最慢的,一般不推荐使用。
appendfsync everysec #每秒钟强制写入磁盘一次,在性能和持久化方面做了很好的折中,是受推荐的方式。
# appendfsync no #完全依赖OS的写入,一般为30秒左右一次,性能最好但是持久化最没有保证,不被推荐。

缺陷:追加log文件可能过大,恢复慢;实时写log会影响redis本身性能

参考资料

上一篇 下一篇

猜你喜欢

热点阅读