当前位置: 首页 > news >正文

【Redis】持久化机制:RDB / AOF 的应用与场景

文章目录

  • Redis 持久化
  • 一、RDB
    • 1.1 说明
    • 1.2 触发机制
      • 手动触发
      • 自动触发
    • 1.3 流程说明
    • 1.4 文件处理
    • 1.5 优缺点 & 适用场景
  • 二、AOF
    • 2.1 说明
    • 2.2 使用 AOF
    • 2.3 命令写入
    • 2.4 文件同步
    • 2.5 重写机制
    • 2.6 启动时数据恢复
    • 2.7 优缺点 & 适用场景
  • 三、不使用 AOF / RDB 的情况
    • 3.1 场景
    • 3.2 实现方案

Redis 持久化

Redis 本身是作用与内存中的数据库,所以必须考虑数据持久化问题(将内存中的数据存储到硬盘中)。

Redis 支持 RDB 与 AOF 两种持久化机制,持久化功能有效地避免因进程退出造成数据丢失问题,当下次重启时利用之前持久化的文件可以实现数据恢复。

在这里插入图片描述


一、RDB

1.1 说明

  1. RDB 持久化是 Redis 默认的持久化方式,通过 快照(snapshot)来持久化数据。
    • 即把当前进程数据生成快照保存到硬盘的过程、触发RDB持久化过程分为手动触发自动触发
  2. Redis 会在指定的时间间隔内生成数据的快照并保存在磁盘中(RDB 文件),通常是 .rdb 文件。(自动触发)、也可以手动执行命令进行手动触发

1.2 触发机制

手动触发

手动触发分别对应 savebgsave 命令:

  • SAVE:会阻塞 Redis 主进程,直到 RDB 持久化完成。这个命令会在当前进程中执行持久化操作,执行过程中 Redis 会暂停所有请求,直到数据保存完成。
    • 但是对于内存较大的实例会造成长时间阻塞,基本不采用。
  • BGSAVE :在后台异步执行RDB持久化,Redis 会生成一个子进程来执行持久化操作,主进程可以继续处理请求。执行 BGSAVE 时,Redis 会创建一个子进程来保存数据并生成 RDB 文件。
    • 阻塞只发生在 fork 阶段,一般时间很短。

Redis 内部所有涉及 RDB 的操作都类似 bgsave 的方式。

自动触发

Redis 运行自动触发 RDB 持久化机制,该机制在实际环境中更实用。

Redis 默认的 RDB 持久化是基于时间和写操作的触发条件。可以通过 redis.conf 配置文件中的 save 参数设置自动触发的条件。

  1. 使用 save 配置。如“save m n” 表示 m 秒内数据集发生了 n 次修改,自动 RDB 持久化。比如:

    save 900 1    # 900秒(15分钟)内至少有1次写操作时触发RDB
    save 300 10   # 300秒(5分钟)内至少有10次写操作时触发RDB
    save 60 10000 # 60秒内至少有10000次写操作时触发RDB
    
  2. 从节点进行全量复制操作时,主节点自动进行RDB持久化,随后将RDB文件内容发送给从节点。

  3. 执行 shutdown 命令关闭 Redis 时,执行 RDB 持久化。

比如在redis.conf的这个位置(内存管理)进行save配置:
在这里插入图片描述


1.3 流程说明

BGSAVE 是主流的 RDB 持久化方式,下图演示了其运作流程:

在这里插入图片描述

  1. 执行 bgsave 命令时,Redis 父进程首先会检查是否已有其他子进程正在执行,如 RDB 或 AOF 子进程。如果存在其他子进程,bgsave 命令将直接返回,不会执行。

  2. 父进程执行 fork 创建子进程,在 fork 过程中,父进程会阻塞。可以通过执行 INFO stats 命令并查看 latest_fork_usec 选项,获取最近一次 fork 操作的耗时,单位为微秒。

  3. fork 完成后,父进程不再阻塞,bgsave 命令返回 “Background saving started” 信息,表示子进程开始生成 RDB 文件,同时父进程可以继续处理其他命令。

  4. 子进程生成 RDB 文件,它会根据父进程的内存内容生成一个临时快照文件,并在完成后将原有文件替换为新生成的 RDB 文件。可以通过执行 lastsave 命令来获取最后一次成功生成 RDB 文件的时间,信息也会在 INFO 统计的 rdb_last_save_time 选项中显示。

  5. 子进程完成任务后,发送信号给父进程,通知父进程操作已完成。随后,父进程会更新相关的统计信息。


1.4 文件处理

  1. 保存:RDB 文件会保存在通过 dir 配置指定的目录中(默认目录为 /var/lib/redis/),文件名通过 dbfilename 配置指定(默认文件名为 dump.rdb)。可以通过执行 config set dir {newDir}config set dbfilename {newFilename} 动态修改目录和文件名设置。当 Redis 重启时,RDB 文件会保存到新的目录。

  2. 压缩:Redis 默认使用 LZF 算法对生成的 RDB 文件进行压缩处理,压缩后的文件体积远小于内存大小。默认情况下,压缩是开启的,可以通过 config set rdbcompression {yes|no} 动态修改压缩设置。

提示:虽然开启 RDB 压缩会消耗一定的 CPU 资源,但可以显著减小文件大小,方便将文件保存到硬盘或通过网络发送到从节点,因此建议开启压缩功能。

  1. 校验:如果 Redis 在启动时加载到损坏的 RDB 文件,启动会失败。此时,可以使用 Redis 提供的 redis-check-dump 工具检测 RDB 文件,并获取相应的错误报告。

1.5 优缺点 & 适用场景

优点:

  1. RDB 是一个紧凑压缩的二进制文件,代表 Redis 某个时间点上的数据快照,适用于备份、全量复制等场景。比如每6h执行 bgsave 备份,并把RDB文件复制到远程及其或者文件系统中(如hdfs)。
  2. Redis 加载 RDB 数据远快于 AOF。在重启Redis时恢复速度较快。
  3. RDB 文件是压缩格式,能够节省存储空间。

缺点:

  1. RDB 方式数据无法做到 实时持久化 / 秒级持久化。因为 bgsave 每次运行都会执行 fork 创建子进程,开销较大,频繁执行成本过高。
  2. RDB 文件使用特定二进制格式保存、Redis 版本演进过程中有多个 RDB 版本,兼容性可能存在风险。
  3. 数据丢失风险较大:RDB 是基于时间间隔的快照,如果在快照之间发生了 Redis 崩溃,则会丢失在最后一次快照之后的所有数据。

适用场景:

适合用于备份和灾难恢复,尤其是对于不要求非常实时的数据恢复场景。


二、AOF

2.1 说明

AOF(Append Only File)持久化:

以独立日志的方式记录每次写命令,重启时再重新执行 AOF 文件中的命令,以达到恢复数据的目的。AOF 主要作用是解决了数据持久化的实时性。

AOF 文件中的内容是 Redis 执行的所有写命令的日志,这些命令可以用来重建数据库状态,目前已经是Redis持久化的主流方式。

2.2 使用 AOF

开启 AOF 功能需要设置配置:appendonly yes ,默认是不开启的。

在这里插入图片描述

AOF 文件名通过 appendfilename 配置指定,默认值为 appendonly.aof,其保存目录与 RDB 持久化方式一致,可通过 dir 配置进行设置。

AOF 的工作流程包括:命令写入(append)、文件同步(sync)、文件重写(rewrite)、重启加载(load)。

AOF 工作流程如下图所示:
AOF 工作流程图

对上图工作流程的解释:

  1. 所有写入命令会被追加到 AOF 缓冲区(aof_buf)中。
  2. 根据配置的同步策略,AOF 缓冲区会定期将数据同步到硬盘。
  3. 随着 AOF 文件增大,Redis 会定期进行文件重写,以压缩文件并减小磁盘占用。
  4. 当 Redis 重启时,可以通过加载 AOF 文件来恢复数据。

2.3 命令写入

AOF 命令写入的内容是文本协议格式,如 set hello world,在AOF缓冲区中会追加的是:

*3\r\n$3\r\nset\r\n$5\r\nhello\r\n$5\r\nworld\r\n

此处遵守的是 Redis 格式协议,Redis 选择的是文本协议,可能有以下原因:

  1. 实现简单
    • 文本协议比二进制协议更加容易实现
  2. 简单性和可读性
    • 数据以纯文本的形式传输,格式简单且直观,用户可以很容易地查看和调试通信内容
  3. 兼容性
    • 文本协议的另一个优点是它具有较高的跨平台兼容性。所有主流的操作系统和编程语言都可以轻松地处理文本数据

AOF 过程中为什么需要 aof_buf 缓冲区?

  • 我们知道,Redis使用单线程响应命令,如果每次写 AOF 文件都直接同步硬盘,从内存的读写变为IO读写,性能必然下降。先写入缓冲区可以有效减少 IO 次数,同时 Redis 还可以提供多种缓冲区策略,让用户根据自己的需求做出合理的平衡。

2.4 文件同步

Redis 提供了多种 AOF 缓冲区同步文件策略,使用参数 appendfsync 控制。不同配置值的含义如下表所示:

表 4-1 AOF 缓冲区同步文件策略

可配置值说明
always每次命令写入 aof_buf 后都调用 fsync 同步,完成后返回。
everysec命令写入 aof_buf 后执行 write 操作,不进行 fsync。每秒由同步线程执行 fsync
no命令写入 aof_buf 后执行 write 操作,由操作系统控制 fsync 的频率。

系统调用 writefsync 的说明

  • write 操作:触发延迟写(delayed write)机制。Linux 内核使用页缓冲区提高硬盘 I/O 性能。write 操作将数据写入系统缓冲区后立即返回,实际的硬盘同步依赖系统调度机制,例如缓冲区满或达到时间周期。若系统发生故障或宕机,未同步的数据可能丢失。
  • fsync 操作:对单个文件进行强制硬盘同步,直到数据写入硬盘前,fsync 会阻塞。

配置说明

  • always 配置:每次写入时都会同步 AOF 文件,性能较差。在普通的 SATA 硬盘上,通常只能支持几百 TPS 写入。除非数据至关重要,否则不推荐使用此配置。
  • no 配置:由于操作系统同步策略不可控,性能较高,但数据丢失的风险大增。除非数据不重要,否则不推荐使用。
  • everysec 配置:为默认配置,也是推荐配置,兼顾了数据安全性与性能。理论上最多丢失 1 秒的数据,适用于大多数场景。

2.5 重写机制

随着 Redis 持续将命令写入 AOF 文件,文件体积会不断增大。为了优化存储和性能,Redis 引入了 AOF 重写机制,它会压缩 AOF 文件的体积。

AOF 重写的过程是将 Redis 进程内的数据转换为写命令,并同步到新的 AOF 文件中。

为什么重写后的 AOF 文件会变小? 主要原因如下:

  • 剔除超时数据:进程内已经超时的数据不会写入重写后的文件。
  • 删除无效命令:旧 AOF 文件中的无效命令(如 delhdelsrem 等)会在重写时被删除,仅保留数据的最终状态。
  • 合并多个写操作:多个连续的写操作可以合并成一条命令。例如,lpush list alpush list blpush list c 可以合并为 lpush list a b c

重写后的 AOF 文件较小,既降低了硬盘的空间占用,又能提高 Redis 启动时的数据恢复速度。

AOF 重写过程可以通过手动和自动两种方式触发:

  • 手动触发:使用 bgrewriteaof 命令。
  • 自动触发:根据 auto-aof-rewrite-min-sizeauto-aof-rewrite-percentage 参数自动触发重写。
    • auto-aof-rewrite-min-size:定义触发重写时 AOF 文件的最小大小,默认为 64MB。
    • auto-aof-rewrite-percentage:定义当前 AOF 文件大小相对于上次重写时增加的比例。

在这里插入图片描述

AOF 重写的执行流程:

  1. 执行 AOF 重写请求
    如果当前进程正在执行 AOF 重写,新的请求会被延迟。如果当前正在执行 bgsave 操作,重写命令会等到 bgsave 完成后再执行。

  2. 父进程执行 fork 创建子进程
    父进程会通过 fork 创建子进程进行重写操作。

  3. 重写过程

    • a. 父进程在 fork 后继续响应其他命令,所有修改操作都会写入 AOF 缓冲区,并根据 appendfsync 策略同步到硬盘,确保旧 AOF 文件的数据完整性。
    • b. 子进程只有在 fork 之前的内存数据,父进程中的修改操作会被写入 AOF 重写缓冲区。
  4. 子进程重写 AOF 文件
    子进程根据内存快照,将命令合并并写入新的 AOF 文件中。

  5. 完成重写

    • a. 子进程写入新文件后,发送信号给父进程。
    • b. 父进程将 AOF 重写缓冲区内临时保存的命令追加到新 AOF 文件中。
    • c. 父进程用新生成的 AOF 文件替换旧的 AOF 文件。

通过上述重写机制,Redis 能有效优化 AOF 文件的体积,提升性能并减少存储消耗。


2.6 启动时数据恢复

当 Redis 启动时,会根据 RDB 和 AOF 文件的内容,进行数据恢复。

在这里插入图片描述


2.7 优缺点 & 适用场景

优点:

  1. AOF 可以实现更高的持久化安全性,相比于 RDB,它更能保证数据不丢失。
  2. 如果 Redis 崩溃,可以从 AOF 文件恢复到最后一个写操作。
  3. 可设置不同的同步策略,以实现平衡的性能和持久化保障。

缺点:

  1. AOF 文件比 RDB 文件更大,因为它记录的是每个写操作的日志,可能会占用更多磁盘空间。
  2. 写操作会稍微慢一些,因为每次写入命令都要追加到 AOF 文件中,虽然可以通过异步写入来缓解性能问题。
  3. AOF 恢复数据时的速度较慢,因为需要重放所有写命令。

适用场景:

AOF 适合用于要求较高数据持久性的场景,例如需要尽量避免数据丢失的应用。


三、不使用 AOF / RDB 的情况

3.1 场景

在实际业务场景下,如果不使用 AOF 或 RDB,Redis 可以与 MySQL 等外部数据库结合,来实现数据的持久化。这种方案通常适用于以下情况:

  1. 缓存加速 + 持久化分离

    • 特点
      • Redis 作为高性能缓存,MySQL 作为真实数据源。
      • 适合读多写少的业务(如商品详情页、用户画像)。
    • 同步策略
      • 读:优先读 Redis,未命中则查 MySQL 并回填。
      • 写:直接写 MySQL,并删除/更新 Redis 缓存(Cache-Aside 模式)。
  2. 临时数据 + 永久存储分离

    • 特点
      • Redis 存储短期高频数据(如会话、排行榜),MySQL 存储长期数据。
      • 适合时效性数据(如 30 天内的订单状态)。
    • 同步策略
      • 通过 TTL 自动清理 Redis 数据,关键数据异步归档到 MySQL。
  3. 高并发写入缓冲

    • 特点
      • 用 Redis 缓冲突发写入(如秒杀库存),再平滑同步到 MySQL。
      • 适合写密集型业务(如点击计数、日志采集)。
    • 同步策略
      • Redis 累加计数,每小时同步一次聚合结果到 MySQL。

3.2 实现方案

  1. 双写模式(Write-Through)

    • 机制
      应用同时写入 Redis 和 MySQL,保持双数据源一致。
      def set_user(user_id, data):# 同步写 MySQLmysql.execute("REPLACE INTO users VALUES (%s, %s)", (user_id, data))# 写 Redisredis.set(f"user:{user_id}", data)
      
    • 优点:强一致性
    • 缺点:写入性能下降,需处理事务回滚(如 MySQL 失败需回滚 Redis)。
  2. 异步同步(Write-Behind)

    • 机制
      先写 Redis,再通过消息队列或定时任务异步同步到 MySQL。
      def set_user(user_id, data):redis.set(f"user:{user_id}", data)# 发送到消息队列(如 Kafka/RabbitMQ)mq.publish("user_update", {"id": user_id, "data": data})# 消费者异步处理 MySQL 写入
      
    • 优点:高性能,解耦
    • 缺点:存在短暂不一致窗口。
  3. 定时批量同步

    • 机制
      定期扫描 Redis 数据批量写入 MySQL(适合冷数据)。
      -- MySQL 表设计示例
      CREATE TABLE redis_backup (`key` VARCHAR(255) PRIMARY KEY,`value` TEXT,`expire_time` DATETIME
      );
      

相关文章:

  • 48-Oracle CDB下的SID-实例名-服务名
  • LVS+Keepliaved高可用群集
  • 【web应用】Vue 3 中实现 Chart.js 柱状图:详细指南
  • 【Leetcode】每日一题 —— No.2966
  • new()和new[]有什么区别?
  • 12.8Java Swing 中的MVC
  • MySQL 类型转换与加密函数深度解析
  • 【AI Study】第四天,Pandas(1)- 基础知识
  • 《仿盒马》app开发技术分享-- 订单结合优惠券结算(60)
  • 【Python打卡Day22】kaggle泰坦尼克@浙大疏锦行
  • 黑马点评,请求被取消,首页店铺类型和blog列表无法正常展示
  • Spring MVC 处理静态资源请求 - ResourceHandler
  • Python多态的简单分享
  • HarmonyOS性能优化——感知流畅优化
  • C++ 第一阶段 基本语法 - 第一节:变量与数据类型详解
  • 19.数学函数
  • eps8266作为AP服务端 esp32c3作为STA客户端
  • LVS +Keepalived 高可用群集
  • 稀疏大模型架构与训练算法研究
  • 【排坑指南】MySQL初始化后,Nacos与微服务无法连接??
  • 怎么对网站链接做拆解/连云港seo公司
  • wordpress新闻动态不显示作者/seo搜索优化服务
  • wordpress 腾讯云插件/手机优化是什么意思
  • 做私活一个网站大概多少钱/怎么推广产品最有效
  • wordpress构建企业网站/seo标签优化
  • 软件开发项目经验/网站优化设计的基础是网站基本要素及每个细节的优化