Redis基础--持久化
Redis 是完全开源免费的,是一个高性能的
key-value
内存数据库。
Redis提供了持久化到磁盘的机制,分别是RDB(Redis DataBase)和AOF(Append Only File)。
持久化流程
- 客户端向服务端发送写操作(数据在客户端的内存中);
- 数据库服务端接收到写请求的数据(数据在服务端的内存中);
- 服务端调用write这个系统调用,将数据往磁盘上写(数据在系统内存的缓冲区中);
- 操作系统将缓冲区中的数据转移到磁盘控制器上(数据在磁盘缓存中);
- 磁盘控制器将数据写到磁盘的物理介质中(数据真正落到磁盘上)。
存在两种情况故障:
- Redis数据库发生故障,只要在上面的第三步执行完毕,那么就可以持久化保存,剩下的两步由操作系统替我们完成;
- 操作系统发生故障,必须上面5步都完成才可以。
redis实现上面5个保存磁盘的步骤。提供了两种策略机制,RDB和AOF。
RDB机制
RDB其实就是把数据以快照的形式保存在磁盘上。RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘。也是默认的持久化方式,这种方式是就是将内存中数据以快照的方式写入到二进制文件中,默认的文件名为dump.rdb。
在我们安装了redis之后,所有的配置都是在redis.conf文件中,里面保存了RDB和AOF两种持久化机制的各种配置。
对于RDB来说,提供了三种机制实现生成一个快照的过程:save、bgsave、自动化。
save触发方式
该命令会阻塞当前Redis服务器,执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止。执行完成时候如果存在老的RDB文件,就把新的替代掉旧的。我们的客户端可能都是几万或者是几十万,这种方式显然不可取。
bgsave触发方式
执行该命令时,Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。
具体操作是Redis进程执行fork操作创建子进程,RDB持久化过程由子进程负责,完成后自动结束。阻塞只发生在fork阶段,一般时间很短。基本上 Redis 内部所有的RDB操作都是采用 bgsave 命令。
自动触发
自动触发是由我们的配置文件来完成的。在redis.conf配置文件中,里面有如下配置,我们可以去设置:
- save:“save m n”。表示m秒内数据集存在n次修改时,自动触发bgsave;
- stop-writes-on-bgsave-error:默认值为yes。当启用了RDB且最后一次后台保存数据失败,Redis是否停止接收数据。如果Redis重启了,那么又可以重新开始接收数据了;
- rdbcompression:默认值是yes。对于存储到磁盘中的快照,可以设置是否进行压缩存储;
- rdbchecksum:默认值是yes。在存储快照后,我们还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。
- dbfilename:设置快照的文件名,默认是 dump.rdb;
- dir:设置快照文件的存放路径,这个配置项一定是个目录,而不能是文件名。
命令 | save | bgsave |
---|---|---|
IO类型 | 同步 | 异步 |
是否阻塞 | 是 | 否(但fork子进程时会阻塞) |
复杂度 | O(n) | O(n) |
优点 | 不消耗额外内存 | 不阻塞客户端命令 |
缺点 | 阻塞客户端命令 | 需要fork,消耗内存 |
优点:
- RDB文件紧凑,全量备份,非常适合用于进行备份和灾难恢复;
- 生成RDB文件的时候,redis主进程会fork()一个子进程来处理所有保存工作,主进程不需要进行任何磁盘IO操作;
- RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。
缺点:
- RDB快照是一次全量备份,当进行快照持久化时,会开启一个子进程专门负责快照持久化,子进程会拥有父进程的内存数据,父进程修改内存子进程不会反应出来,所以在快照持久化期间修改的数据不会被保存,可能丢失数据。
AOF机制
全量备份总是耗时,有时候我们提供一种更加高效的方式AOF,工作机制很简单,redis会将每一个收到的写命令都通过write函数追加到文件中。就是日志记录。
持久化原理:每当有一个写命令过来时,就直接保存在AOF文件中。
文件重写原理:AOF的方式也同时带来了另一个问题。持久化文件会变的越来越大。为了压缩aof的持久化文件。redis提供了bgrewriteaof命令。将内存中的数据以命令的方式保存到临时文件中,同时会fork出一条新进程来将文件重写。
重写aof文件的操作,并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似。
三种触发机制
- 每修改同步always:同步持久化,每次发生数据变更会被立即记录到磁盘 ,能较差但数据完整性比较好;
- 每秒同步everysec:异步操作,每秒记录,如果一秒内宕机,有数据丢失;
- 不同no:从不同步。
命令 | always | everysec | no |
---|---|---|---|
优点 | 不丢失数据 | 每秒以此fsync | 不管用 |
缺点 | 磁盘IO开销大 | 存在丢1秒数据的风险 | 不可控 |
优点
- AOF可以更好的保护数据不丢失,一般AOF会每隔1秒,通过一个后台线程执行一次fsync操作,最多丢失1秒钟的数据;
- AOF日志文件没有任何磁盘寻址的开销,写入性能非常高,文件不容易破损;
- AOF日志文件即使过大的时候,出现后台重写操作,也不会影响客户端的读写;
- AOF日志文件的命令通过非常可读的方式进行记录,这个特性非常适合做灾难性的误删除的紧急恢复。比如某人不小心用flushall命令清空了所有数据,只要这个时候后台rewrite还没有发生,那么就可以立即拷贝AOF文件,将最后一条flushall命令给删了,然后再将该AOF文件放回去,就可以通过恢复机制,自动恢复所有数据。
缺点:
- 对于同一份数据来说,AOF日志文件通常比RDB数据快照文件更大;
- AOF开启后,支持的写QPS会比RDB支持的写QPS低,因为AOF一般会配置成每秒fsync一次日志文件,当然,每秒一次fsync,性能也还是很高的;
RDB和AOF对比
要根据自己的需求自行配置;
命令 | RDB | AOF |
---|---|---|
启动优先级 | 低 | 高 |
体积 | 小 | 大 |
恢复速度 | 快 | 慢 |
数据安全性 | 丢数据 | 根据策略而定 |
轻重 | 重 | 轻 |