【Redis】持久化机制:RDB / AOF 的应用与场景
文章目录
- Redis 持久化
- 一、RDB
- 1.1 说明
- 1.2 触发机制
- 手动触发
- 自动触发
- 1.3 流程说明
- 1.4 文件处理
- 1.5 优缺点 & 适用场景
- 二、AOF
- 2.1 说明
- 2.2 使用 AOF
- 2.3 命令写入
- 2.4 文件同步
- 2.5 重写机制
- 2.6 启动时数据恢复
- 2.7 优缺点 & 适用场景
- 三、不使用 AOF / RDB 的情况
- 3.1 场景
- 3.2 实现方案
Redis 持久化
Redis 本身是作用与内存中的数据库,所以必须考虑数据持久化问题(将内存中的数据存储到硬盘中)。
Redis 支持 RDB 与 AOF 两种持久化机制,持久化功能有效地避免因进程退出造成数据丢失问题,当下次重启时利用之前持久化的文件可以实现数据恢复。
一、RDB
1.1 说明
- RDB 持久化是 Redis 默认的持久化方式,通过 快照(snapshot)来持久化数据。
- 即把当前进程数据生成快照保存到硬盘的过程、触发RDB持久化过程分为手动触发与自动触发。
- Redis 会在指定的时间间隔内生成数据的快照并保存在磁盘中(RDB 文件),通常是 .rdb 文件。(自动触发)、也可以手动执行命令进行手动触发
1.2 触发机制
手动触发
手动触发分别对应 save
与 bgsave
命令:
- SAVE:会阻塞 Redis 主进程,直到 RDB 持久化完成。这个命令会在当前进程中执行持久化操作,执行过程中 Redis 会暂停所有请求,直到数据保存完成。
- 但是对于内存较大的实例会造成长时间阻塞,基本不采用。
- BGSAVE :在后台异步执行RDB持久化,Redis 会生成一个子进程来执行持久化操作,主进程可以继续处理请求。执行 BGSAVE 时,Redis 会创建一个子进程来保存数据并生成 RDB 文件。
- 阻塞只发生在 fork 阶段,一般时间很短。
Redis 内部所有涉及 RDB 的操作都类似 bgsave 的方式。
自动触发
Redis 运行自动触发 RDB 持久化机制,该机制在实际环境中更实用。
Redis 默认的 RDB 持久化是基于时间和写操作的触发条件。可以通过 redis.conf 配置文件中的 save 参数设置自动触发的条件。
-
使用
save
配置。如“save m n
” 表示 m 秒内数据集发生了 n 次修改,自动 RDB 持久化。比如:save 900 1 # 900秒(15分钟)内至少有1次写操作时触发RDB save 300 10 # 300秒(5分钟)内至少有10次写操作时触发RDB save 60 10000 # 60秒内至少有10000次写操作时触发RDB
-
从节点进行全量复制操作时,主节点自动进行RDB持久化,随后将RDB文件内容发送给从节点。
-
执行
shutdown
命令关闭 Redis 时,执行 RDB 持久化。
比如在redis.conf
的这个位置(内存管理)进行save
配置:
1.3 流程说明
BGSAVE
是主流的 RDB 持久化方式,下图演示了其运作流程:
-
执行
bgsave
命令时,Redis 父进程首先会检查是否已有其他子进程正在执行,如 RDB 或 AOF 子进程。如果存在其他子进程,bgsave
命令将直接返回,不会执行。 -
父进程执行
fork
创建子进程,在fork
过程中,父进程会阻塞。可以通过执行INFO stats
命令并查看latest_fork_usec
选项,获取最近一次fork
操作的耗时,单位为微秒。 -
fork
完成后,父进程不再阻塞,bgsave
命令返回 “Background saving started” 信息,表示子进程开始生成 RDB 文件,同时父进程可以继续处理其他命令。 -
子进程生成 RDB 文件,它会根据父进程的内存内容生成一个临时快照文件,并在完成后将原有文件替换为新生成的 RDB 文件。可以通过执行
lastsave
命令来获取最后一次成功生成 RDB 文件的时间,信息也会在INFO
统计的rdb_last_save_time
选项中显示。 -
子进程完成任务后,发送信号给父进程,通知父进程操作已完成。随后,父进程会更新相关的统计信息。
1.4 文件处理
-
保存:RDB 文件会保存在通过
dir
配置指定的目录中(默认目录为/var/lib/redis/
),文件名通过dbfilename
配置指定(默认文件名为dump.rdb
)。可以通过执行config set dir {newDir}
和config set dbfilename {newFilename}
动态修改目录和文件名设置。当 Redis 重启时,RDB 文件会保存到新的目录。 -
压缩:Redis 默认使用 LZF 算法对生成的 RDB 文件进行压缩处理,压缩后的文件体积远小于内存大小。默认情况下,压缩是开启的,可以通过
config set rdbcompression {yes|no}
动态修改压缩设置。
提示:虽然开启 RDB 压缩会消耗一定的 CPU 资源,但可以显著减小文件大小,方便将文件保存到硬盘或通过网络发送到从节点,因此建议开启压缩功能。
- 校验:如果 Redis 在启动时加载到损坏的 RDB 文件,启动会失败。此时,可以使用 Redis 提供的
redis-check-dump
工具检测 RDB 文件,并获取相应的错误报告。
1.5 优缺点 & 适用场景
优点:
- RDB 是一个紧凑压缩的二进制文件,代表 Redis 某个时间点上的数据快照,适用于备份、全量复制等场景。比如每6h执行 bgsave 备份,并把RDB文件复制到远程及其或者文件系统中(如hdfs)。
- Redis 加载 RDB 数据远快于 AOF。在重启Redis时恢复速度较快。
- RDB 文件是压缩格式,能够节省存储空间。
缺点:
- RDB 方式数据无法做到 实时持久化 / 秒级持久化。因为 bgsave 每次运行都会执行 fork 创建子进程,开销较大,频繁执行成本过高。
- RDB 文件使用特定二进制格式保存、Redis 版本演进过程中有多个 RDB 版本,兼容性可能存在风险。
- 数据丢失风险较大:RDB 是基于时间间隔的快照,如果在快照之间发生了 Redis 崩溃,则会丢失在最后一次快照之后的所有数据。
适用场景:
适合用于备份和灾难恢复,尤其是对于不要求非常实时的数据恢复场景。
二、AOF
2.1 说明
AOF(Append Only File)持久化:
以独立日志的方式记录每次写命令,重启时再重新执行 AOF 文件中的命令,以达到恢复数据的目的。AOF 主要作用是解决了数据持久化的实时性。
AOF 文件中的内容是 Redis 执行的所有写命令的日志,这些命令可以用来重建数据库状态,目前已经是Redis持久化的主流方式。
2.2 使用 AOF
开启 AOF 功能需要设置配置:appendonly yes
,默认是不开启的。
AOF 文件名通过 appendfilename
配置指定,默认值为 appendonly.aof
,其保存目录与 RDB 持久化方式一致,可通过 dir
配置进行设置。
AOF 的工作流程包括:命令写入(append)、文件同步(sync)、文件重写(rewrite)、重启加载(load)。
AOF 工作流程如下图所示:
对上图工作流程的解释:
- 所有写入命令会被追加到 AOF 缓冲区(
aof_buf
)中。 - 根据配置的同步策略,AOF 缓冲区会定期将数据同步到硬盘。
- 随着 AOF 文件增大,Redis 会定期进行文件重写,以压缩文件并减小磁盘占用。
- 当 Redis 重启时,可以通过加载 AOF 文件来恢复数据。
2.3 命令写入
AOF 命令写入的内容是文本协议格式,如 set hello world
,在AOF缓冲区中会追加的是:
*3\r\n$3\r\nset\r\n$5\r\nhello\r\n$5\r\nworld\r\n
此处遵守的是 Redis 格式协议,Redis 选择的是文本协议,可能有以下原因:
- 实现简单
- 文本协议比二进制协议更加容易实现
- 简单性和可读性
- 数据以纯文本的形式传输,格式简单且直观,用户可以很容易地查看和调试通信内容
- 兼容性
- 文本协议的另一个优点是它具有较高的跨平台兼容性。所有主流的操作系统和编程语言都可以轻松地处理文本数据
AOF 过程中为什么需要 aof_buf
缓冲区?
- 我们知道,Redis使用单线程响应命令,如果每次写 AOF 文件都直接同步硬盘,从内存的读写变为IO读写,性能必然下降。先写入缓冲区可以有效减少 IO 次数,同时 Redis 还可以提供多种缓冲区策略,让用户根据自己的需求做出合理的平衡。
2.4 文件同步
Redis 提供了多种 AOF 缓冲区同步文件策略,使用参数 appendfsync
控制。不同配置值的含义如下表所示:
表 4-1 AOF 缓冲区同步文件策略
可配置值 | 说明 |
---|---|
always | 每次命令写入 aof_buf 后都调用 fsync 同步,完成后返回。 |
everysec | 命令写入 aof_buf 后执行 write 操作,不进行 fsync 。每秒由同步线程执行 fsync 。 |
no | 命令写入 aof_buf 后执行 write 操作,由操作系统控制 fsync 的频率。 |
系统调用 write
和 fsync
的说明:
write
操作:触发延迟写(delayed write)机制。Linux 内核使用页缓冲区提高硬盘 I/O 性能。write
操作将数据写入系统缓冲区后立即返回,实际的硬盘同步依赖系统调度机制,例如缓冲区满或达到时间周期。若系统发生故障或宕机,未同步的数据可能丢失。fsync
操作:对单个文件进行强制硬盘同步,直到数据写入硬盘前,fsync
会阻塞。
配置说明:
always
配置:每次写入时都会同步 AOF 文件,性能较差。在普通的 SATA 硬盘上,通常只能支持几百 TPS 写入。除非数据至关重要,否则不推荐使用此配置。no
配置:由于操作系统同步策略不可控,性能较高,但数据丢失的风险大增。除非数据不重要,否则不推荐使用。everysec
配置:为默认配置,也是推荐配置,兼顾了数据安全性与性能。理论上最多丢失 1 秒的数据,适用于大多数场景。
2.5 重写机制
随着 Redis 持续将命令写入 AOF 文件,文件体积会不断增大。为了优化存储和性能,Redis 引入了 AOF 重写机制,它会压缩 AOF 文件的体积。
AOF 重写的过程是将 Redis 进程内的数据转换为写命令,并同步到新的 AOF 文件中。
为什么重写后的 AOF 文件会变小? 主要原因如下:
- 剔除超时数据:进程内已经超时的数据不会写入重写后的文件。
- 删除无效命令:旧 AOF 文件中的无效命令(如
del
、hdel
、srem
等)会在重写时被删除,仅保留数据的最终状态。 - 合并多个写操作:多个连续的写操作可以合并成一条命令。例如,
lpush list a
、lpush list b
、lpush list c
可以合并为lpush list a b c
。
重写后的 AOF 文件较小,既降低了硬盘的空间占用,又能提高 Redis 启动时的数据恢复速度。
AOF 重写过程可以通过手动和自动两种方式触发:
- 手动触发:使用
bgrewriteaof
命令。 - 自动触发:根据
auto-aof-rewrite-min-size
和auto-aof-rewrite-percentage
参数自动触发重写。auto-aof-rewrite-min-size
:定义触发重写时 AOF 文件的最小大小,默认为 64MB。auto-aof-rewrite-percentage
:定义当前 AOF 文件大小相对于上次重写时增加的比例。
AOF 重写的执行流程:
-
执行 AOF 重写请求:
如果当前进程正在执行 AOF 重写,新的请求会被延迟。如果当前正在执行bgsave
操作,重写命令会等到bgsave
完成后再执行。 -
父进程执行
fork
创建子进程:
父进程会通过fork
创建子进程进行重写操作。 -
重写过程:
- a. 父进程在
fork
后继续响应其他命令,所有修改操作都会写入 AOF 缓冲区,并根据appendfsync
策略同步到硬盘,确保旧 AOF 文件的数据完整性。 - b. 子进程只有在
fork
之前的内存数据,父进程中的修改操作会被写入 AOF 重写缓冲区。
- a. 父进程在
-
子进程重写 AOF 文件:
子进程根据内存快照,将命令合并并写入新的 AOF 文件中。 -
完成重写:
- a. 子进程写入新文件后,发送信号给父进程。
- b. 父进程将 AOF 重写缓冲区内临时保存的命令追加到新 AOF 文件中。
- c. 父进程用新生成的 AOF 文件替换旧的 AOF 文件。
通过上述重写机制,Redis 能有效优化 AOF 文件的体积,提升性能并减少存储消耗。
2.6 启动时数据恢复
当 Redis 启动时,会根据 RDB 和 AOF 文件的内容,进行数据恢复。
2.7 优缺点 & 适用场景
优点:
- AOF 可以实现更高的持久化安全性,相比于 RDB,它更能保证数据不丢失。
- 如果 Redis 崩溃,可以从 AOF 文件恢复到最后一个写操作。
- 可设置不同的同步策略,以实现平衡的性能和持久化保障。
缺点:
- AOF 文件比 RDB 文件更大,因为它记录的是每个写操作的日志,可能会占用更多磁盘空间。
- 写操作会稍微慢一些,因为每次写入命令都要追加到 AOF 文件中,虽然可以通过异步写入来缓解性能问题。
- AOF 恢复数据时的速度较慢,因为需要重放所有写命令。
适用场景:
AOF 适合用于要求较高数据持久性的场景,例如需要尽量避免数据丢失的应用。
三、不使用 AOF / RDB 的情况
3.1 场景
在实际业务场景下,如果不使用 AOF 或 RDB,Redis 可以与 MySQL 等外部数据库结合,来实现数据的持久化。这种方案通常适用于以下情况:
-
缓存加速 + 持久化分离
- 特点:
- Redis 作为高性能缓存,MySQL 作为真实数据源。
- 适合读多写少的业务(如商品详情页、用户画像)。
- 同步策略:
- 读:优先读 Redis,未命中则查 MySQL 并回填。
- 写:直接写 MySQL,并删除/更新 Redis 缓存(Cache-Aside 模式)。
- 特点:
-
临时数据 + 永久存储分离
- 特点:
- Redis 存储短期高频数据(如会话、排行榜),MySQL 存储长期数据。
- 适合时效性数据(如 30 天内的订单状态)。
- 同步策略:
- 通过 TTL 自动清理 Redis 数据,关键数据异步归档到 MySQL。
- 特点:
-
高并发写入缓冲
- 特点:
- 用 Redis 缓冲突发写入(如秒杀库存),再平滑同步到 MySQL。
- 适合写密集型业务(如点击计数、日志采集)。
- 同步策略:
- Redis 累加计数,每小时同步一次聚合结果到 MySQL。
- 特点:
3.2 实现方案
-
双写模式(Write-Through)
- 机制:
应用同时写入 Redis 和 MySQL,保持双数据源一致。def set_user(user_id, data):# 同步写 MySQLmysql.execute("REPLACE INTO users VALUES (%s, %s)", (user_id, data))# 写 Redisredis.set(f"user:{user_id}", data)
- 优点:强一致性
- 缺点:写入性能下降,需处理事务回滚(如 MySQL 失败需回滚 Redis)。
- 机制:
-
异步同步(Write-Behind)
- 机制:
先写 Redis,再通过消息队列或定时任务异步同步到 MySQL。def set_user(user_id, data):redis.set(f"user:{user_id}", data)# 发送到消息队列(如 Kafka/RabbitMQ)mq.publish("user_update", {"id": user_id, "data": data})# 消费者异步处理 MySQL 写入
- 优点:高性能,解耦
- 缺点:存在短暂不一致窗口。
- 机制:
-
定时批量同步
- 机制:
定期扫描 Redis 数据批量写入 MySQL(适合冷数据)。-- MySQL 表设计示例 CREATE TABLE redis_backup (`key` VARCHAR(255) PRIMARY KEY,`value` TEXT,`expire_time` DATETIME );
- 机制: