11 AOF持久化

2018-09-26 本文已影响0人猪大金

Redis还提供了AOF持久化功能。与RDB持久化通过保存数据中的键值对来记录数据库状态不同，AOF持久化是通过保存Redis服务器所执行的写命令来记录数据库状态的。
被写入AOF文件的所有命令都是以Redis的命令请求协议格式保存的，因为Redis的命令请求协议是纯文本格式。
服务器在启动时，可以通过载入和执行AOF文件中保存的命令来还原数据库关闭之前的数据库状态。

11.1 AOF持久化的实现

AOF持久化功能的实现可以分为命令追加(append)、文件写入、文件同步(sync)三个步骤。

11.1.1 命令追加

当AOF持久化功能处于打开状态时，服务器在执行完一个写命令之后，会以协议格式将被执行的写命令追加到服务器状态的aof_buf缓冲区的末尾：

struct redisServer{
    // ...

    // AOF缓冲区
    sds aof_buf;

    //...
};

11.1.2 AOF文件的写入与同步

Redis的服务器进程就是一个事件循环(loop)，这个循环中的文件事件负责接收客户端的命令请求，以及向客户端发送命令回复，而时间事件则负责执行像serverCron函数这样需要定时运行的函数。
因为服务器在处理文件事件时可能会执行写命令，使得一些内容被追加到aof_buf缓冲区里面，所以在服务器每次结束一个事件循环之前，它都会调用flushAppendOnlyFile函数，考虑是否需要将aof_buf缓冲区中的内容写入和保存到AOF文件里面。
flushAppendOnlyFile函数的行为由服务器配置的appendfsync选项的值来决定。

`appendfsync`选项的值	`flushAppendOnlyFile`函数的行为
`always`	将`aof_buf`缓冲区中的所有内容写入并同步到`AOF`文件
`everysec`	将`aof_buf`缓冲区中的所有内容写入`AOF`文件，如果上次同步`AOF`文件的时间距离现在超过一秒钟，那么再次对`AOF`文件进行同步，并且这个同步操作是由一个线程专门负责执行的
`no`	将`aof_buf`缓存区中的所有内容写入到`AOF`文件，单并不对`AOF`文件进行同步，何时同步由操作系统来决定

如果用户没有主动为appendfsync选项这只值，那么appendfsync选项的默认值为everysec。

文件的写入和同步
为了提高文件的写入效率，现在操作系统中，当用户调用write函数，将一些数据写入到文件的时候，操作系统通常会将写入数据暂时保存在一个内存缓存区里面，等到缓冲区的空间被填满、或者超过了指定的时限之后，才真正的将缓冲区中的数据写入到磁盘里面。
这种做法虽然提高了效率，但也为写入数据带来了安全性问题，如果宕机，保存在内存缓冲区中的写入数据将会丢失.
为此，系统提供了fsync和fdatasync两个同步函数，他们可以强制让操作系统立即将缓冲区中的数据写入到硬盘里面，从而确保写入数据的安全性。

AOF持久化的效率和安全性
服务器配置appendsync选项的值直接决定AOF持久化功能的效率和安全性。
当appendsync的值为always时，服务器在每个时间循环都要将aof_buf缓冲区的所有内容写入到AOF文件，并且同步AOF文件，所有always的效率是appendsync最慢的一个，但是也是最安全的，宕机出现，AOF持久化也只会丢失一个事件循环中所产生的命令数据。
当appendsync的值为everysec时，服务器在每个事件循环都要将aof_buf缓冲区的所有内容写入到AOF文件，并且每隔一秒就要在子线程中对AOF文件进行一次同步。效率上足够快，并且就算出现故障宕机，数据库也只会丢失一秒钟的命令数据。
当appendsync的值为no时，服务器在每个事件循环都要将aof_buf缓冲区中的所有内容写入到AOF文件中，至于何时对AOF文件进行同步，则由操作系统控制。因此该模式速度最快，不过因为这种模式会在缓存中积累一段时间的写入数据，所以单次同步时长是最长的。从平摊的角度上看，no模式和everysec模式的效率类似。但是宕机丢失的数据最多。

11.2 AOF文件的载入与数据还原

因为AOF文件里面包含了重建数据库状态所需的所有写命令，所以服务器只要读入并重新执行一遍AOF文件里面保存的写命令，就可以还原服务器关闭之前的数据库祖状态。
Redis读取AOF文件并还原数据库状态的详细步骤如下：

创建一个不带网路连接的伪客户端：伪客户端执行命令的效果和带网络连接的客户端执行命令效果完全一样。
从AOF文件中分析并读取一条写命令。
使用伪客户端执行被读出的写命令。
一直执行步骤2和步骤3，直到AOF文件中的所有写命令都被处理完毕为止。

当完成以上步骤之后，AOF文件所保存的数据库状态就会被完整的还原出来。

11.3 AOF重写

因为AOF持久化是通过保存被执行的写命令来记录数据库状态的，所以随着服务器运行时间的流逝，AOF文件中的内容就会越来越多，带来很多的问题。
为了解决AOF文件体积膨胀的问题，Redis提供了AOF文件重写功能，通过该功能，Redis服务器可以创建一个新的AOF文件来代替现有的AOF文件，新旧两个AOF文件所保存的数据库状态相同，但新AOF文件不会包含任何浪费空间的冗余命令，所以新AOF文件的体积通常会比旧AOF文件的体积要小得多。

11.3.1 AOF文件重写的实现

虽然Redis将生成新AOF文件替换旧AOF文件的功能命令为“AOF文件重写”，但实际上，AOF文件重写并不需要对现有的AOF文件进行任何读取、分析或者写入操作，这个功能是通过读取服务器当前的数据库状态来实现的。
首先从数据库中读取键现在的值，然后用一条记录去记录键值对，代替之前记录这个键值对的多条命令，这就是AOF重写功能的实现原理。
新的AOF文件只包含当前数据库状态所必须的命令，所以新的AOF文件不会浪费任何硬盘空间。

11.3.2 AOF后台重写

AOF重写程序aof_rewrite函数可以很好的完成创建一个新AOF文件任务，但是，因为这个函数会进行大量的写入操作，所以调用这个函数的线程将被长时间阻塞，因为Redis服务器使用单个线程来处理命令请求，所以如果由服务器直接调用aof_rewrite函数的话，那么在重写AOF文件期间，服务器将无法处理客户端发来的命令请求。
Redis将AOF重写程序放到子进程里执行，这样做可以同时达到两个目的：

子进程进行AOF重写期间，服务器进程（父进程）可以继续处理命令请求。
子进程带有服务器进程的数据副本，使用子进程而不是线程，可以在避免使用锁的情况下，保证数据的安全性。

不过，使用子进程也有一个问题需要解决，因为子进程在进行AOF重写期间，服务器还需要继续处理命令请求，而新的命令可能会对现有的数据库状态进行修改，从而使得服务器当前的数据库状态和重写后的AOF文件所保存的数据库状态不一致。
为了解决这种数据不一致问题，Redis服务器设置一个AOF重写缓冲区，这个缓冲区在服务器创建子进程之后开始使用，当Redis服务器执行完一个写命令之后，它会同时将这个写命令发送给AOF缓冲区和AOF重写缓冲区。
也就是说，在子进程执行AOF重写期间，服务器进程需要执行以下三个工作：

执行客户端发来的命令
将执行后的写命令追加到AOF缓冲区
将执行后的写命令追加到AOF重写缓冲区

这样一来可以保证：

AOF缓冲区的内容会定期被写入和同步到AOF文件，对现有AOF文件的处理工作会如常进行。
从创建子进程开始，服务器执行的所有写命令都会被记录到AOF重写缓冲区里面

当子进程完成AOF重写工作之后,它会向父进程发送一个信号，父进程在接受到该信号之后，会调用一个信号处理函数，并执行以下工作：

将AOF重写缓冲区中的所有内容写入到新的AOF文件中，这时新AOF文件所保存的数据库状态和服务器当前的数据库状态一致。
对新的AOF文件进行改名。原子的覆盖现有的AOF文件，完成新旧两个AOF文件的替换

这个信号处理函数执行完毕之后，父进程就可以继续像往常一样接受命令请求了。
在整个AOF后台重写过程中，只有信号处理函数执行会对服务器进程(父进程)造成阻塞，在其他时候，AOF后台重写都不会阻塞父进程，这将AOF重写对服务器性能造成的影响降到最低。
以上就是AOF后台重写，也即是BGREWRITEAOF命令的实现原理。