[Redis][11][AOF持久化]

第 11 章 AOF持久化

AOF持久化是通过保存Redis服务器所执行的写命令来记录数据库状态的。服务器在启动时,可以通过载入和执行AOF文件中保存的令来还原服务器关闭之前的数据库状态。

11.1 AOF持久化的实现

AOF持久化功能的实现可以分为命令追加文件写入文件同步三个步骤。

11.1.1 命令追加

当AOF持久化功能处于打开状态时,服务器在执行完一个写命令之后,会以协议格式将被执行的写命令追加到服务器状态的aof_buf缓冲区的末尾

11.1.2 AOF文件的写入与同步

Redis的服务器进程就是一个事件循环,这个循环中的文件事件负责接收客户端的命令请求,以及向客户端发送命令回复,而时间事件则负责执行像serveCron函数这样需要定时运行的函数。下一章将解释这些内容

因为服务器在处理文件事件时可能会执行写命令,使得一些内容被追加到aof_buf缓冲区里面,所以在服务器每次结束一个事件循环之前,它都会调用flushAppendonlyFile函数,考虑是否需要将aof_buf缓冲区中的内容写入和保存到AOF文件里面

伪代码大概如下

1
2
3
4
5
6
7
8
9
10
11
def eventLoop():
while True:

# 处理文件请求,处理请求时可能会把新内容追加到aof_buf缓冲区
processFileEvents()

# 处理时间请求
processTimeEvents()

# 考虑是否将aof_buf中的内容写入和保存到AOF文件中
flushAppendOnlyFile()

flushAppendOnlyFile()函数的策略由服务器配置的appendfsync选项的值来决定

配置 行为
always 将aof_buf缓冲区中的所有内容写入步到AOF文件
everysec 将aof_buf缓冲区中的所有内容写入到AOF文件,如果上次同步AOF文件的时间距离现在超过了1秒,那么再次对AOF文件进行同步
no 将aof_buf缓冲区中的所有内容写入到AOF文件,但并不对AOF文件进行同步,同步由系统决定

下面解释什么是文件的写入同步

  • 为了提高文件的写入效率,在现代操作系统中,当用户调用write函数,将一些数据写入到文件的时候,操作系统通常会将写入数据暂时保存在一个内存缓冲区里面,
  • 等到缓冲区的空间被填满、或者超过了指定的时限之后,才真正地将缓冲区中的数据写入到磁盘里面。
  • 用户将数据写入到内存缓冲区的过程叫做写入
  • 系统将内存缓冲区的内容写入到磁盘对应的文件的过程叫做同步

11.2 AOF文件的载入与数据还原

服务器只要读入并重新执行一遍AOF文件里面保存的写命令,就可以还原服务器关闭之前的数据库状态。

Redis读取AOF文件并还原数据库状态的步骤如下

  1. 创建一个不带网络连接的伪客户端,因为Redis的命令只能在客户端上下文中执行
  2. 从AOF文件中分析并读取出一条写命令。
  3. 使用伪客户端执行被读出的写命令。
  4. 一直执行步骤2和步骤3,直到AOF文件中的所有写命令都被处理完毕为止。

流程图如下

11.3 AOF重写

因为AOF持久化是通过保存被执行的写命令来记录数据库状态的,所以随着服务器运行时间的流逝,AOF文件中的内容会越来越

为了解决AOF文件体积膨胀的问题, Redis提供了AOF文件重写功能。通过该功能,Redis服务器可以创建一个新的AOF文件来替代现有的AOF文件,新旧两个AOF文件所保存的数据库状态相同,但新文件中不包括冗余指令

11.3.1 AOF文件重写的实现

其实AOF文件的重写策略十分简单,它并不查看旧文件的任何内容。它直接根据当前的数据库状态生成一份新的AOF文件。

例如,假设我们对一个list进行了如下操作

1
2
3
4
5
6
RPUSH list "A" "B" "C"
RPUSH list "C"
RPUSH list "D" "E"
LPOP list
LPOP list
RPUSH list "F" "G"

那么其实,在此时的数据库状态中,list键的值只有{"C", "D", "E", "F", "G"}而已

在执行AOF重写时,Redis直接查看list键的当前值,然后将当前的这五个值用同一条RPUSH命令存储,仅此而已

1
RPUSH list "C" "D" "E" "F" "G"

假设我们要对下面这个数据库状态进行AOF重写

重写后的AOF文件包含如下命令

1
2
3
4
5
6
7
8
9
10
11
SELECT 0

RPUSH alphabet "a" "b" "c"

EXPIREAT alphabet 1385877600000

HSET book "name" "Redisin Action" "author" "Josiah L.Carlson"

EXPIREAT book 1385877600000

SET message "hello, world"

11.3.2 AOF后台重写

Redis不希望AOF重写造成服务器无法处理请求,所以Redis决定将AOF重写程序放到子进程里执行,这样子进程进行AOF重写期间,服务器进程(父进程)可以继续处理命令请求。

不过,子进程在进行AOF重写期间,服务器进程还需要继续处理命令请求,而新的命令可能会对现有的数据库状态进行修改,从而使得服务器当前的数据库状态和重写后的AOF文件所保存的数据库状态不一致。例子如下表所示

为了解决这种数据不一致问题,Redis服务器设置了一个AOF重写缓冲区,这个缓冲区在服务器创建子进程之后开始使用,当Redis服务器执行完一个写命令之后,它会同时将这个写命令发送给AOF缓冲区和AOF重写缓冲区,如下图

这样,当子进程完成AOF重写工作后,它会给父进程发送一个信号,父进程接到这个信号后,会阻塞所有请求,并执行如下操作

  1. AOF重写缓冲区中的内容写入到AOF文件中,这时新AOF文件所保存的数据库状态将与服务器状态完全相同
  2. 对新的AOF文件进行改名,原子的覆盖现有的AOF文件,完成两个文件的替换

11.4 重点回顾