当前位置: 首页 > news >正文

【Java 开发日记】MySQL 与 Redis 如何保证双写一致性?

目录

前言

一、基础概念:为什么会有不一致?

二、核心策略与模式

策略一:Cache-Aside Pattern(旁路缓存模式)

策略二:Write-Through / Read-Through Pattern(穿透读写模式)

策略三:Write-Behind Pattern(异步写回模式)

三、保证最终一致性的进阶方案

方案一:延迟双删

方案二:通过消息队列异步删除

方案三:通过数据库 Binlog 同步(最优解)

四、总结与最佳实践选择


前言

首先,我们必须明确一个核心观点:在分布式环境下,要实现强一致性(在任何时刻读取的数据都是最新的)是极其困难且代价高昂的,通常会严重牺牲性能。因此,在实践中,我们通常追求最终一致性,即允许在短暂的时间内数据不一致,但通过一些手段保证数据最终会保持一致。

下面我将从基础概念、各种策略、最佳实践到最新方案,为你详细讲解。

一、基础概念:为什么会有不一致?

在一个包含 MySQL(作为可靠数据源)和 Redis(作为缓存)的系统中,所有的写操作(增、删、改)都必须同时处理这两个地方。

这个过程中,任何一步失败或延迟都会导致不一致:

  1. 写 MySQL 成功,写 Redis 失败:导致 Redis 中是旧数据。
  2. 写 Redis 成功,写 MySQL 失败:导致 Redis 中是“脏数据”,数据库中不存在。
  3. 并发读写:一个线程在更新数据库,但还没更新缓存时,另一个线程读取了旧的缓存数据。

二、核心策略与模式

解决双写一致性有多种策略,我们需要根据业务场景(对一致性的要求、读写的比例等)进行选择。

策略一:Cache-Aside Pattern(旁路缓存模式)

这是最常用、最经典的缓存模式。核心原则是:应用程序直接与数据库和缓存交互,缓存不作为写入的必经之路。

  • 读流程
    1. 收到读请求。
    2. 首先查询 Redis,如果数据存在(缓存命中),直接返回。
    3. 如果 Redis 中没有数据(缓存未命中),则从 MySQL 中查询。
    4. 将从 MySQL 查询到的数据写入 Redis(以便后续读取),然后返回数据。
  • 写流程
    1. 收到写请求。
    2. 更新 MySQL 中的数据。
    3. 删除 Redis 中对应的缓存。

为什么是删除(Invalidate)缓存,而不是更新缓存?
这是一个关键设计点!

  • 性能:如果更新缓存,每次数据库写操作都要伴随一次缓存写操作,如果该数据并不经常被读取,那么这次缓存写入就是浪费资源的。
  • 并发安全:在并发写场景下,更新缓存的顺序可能与更新数据库的顺序不一致,导致缓存中是旧数据。而删除操作是幂等的,更为安全。

Cache-Aside 如何保证一致性?
它通过“先更新数据库,再删除缓存”来尽力保证。但它依然存在不一致的窗口期:

  1. 线程 A 更新数据库。
  2. 线程 B 读取数据,发现缓存不存在,从数据库读取旧数据(因为 A 还没提交或刚提交)。
  3. 线程 B 将旧数据写入缓存。
  4. 线程 A 删除缓存。

这种情况发生的概率较低,因为通常数据库写操作(步骤1)会比读操作(步骤2)耗时更长(因为涉及锁、日志等),所以步骤2在步骤1之前完成的概率很小。但这是一种理论上的可能。

策略二:Write-Through / Read-Through Pattern(穿透读写模式)

在这种模式下,缓存层(或一个独立的服务)自己负责与数据库交互。对应用来说,它只与缓存交互。

  • 写流程:应用写入缓存,缓存组件同步地写入数据库。只有两个都成功后才会返回成功。
  • 读流程:应用读取缓存,如果未命中,缓存组件自己从数据库加载并填充缓存,然后返回。

优点:逻辑对应用透明,一致性比 Cache-Aside 更好。
缺点:性能较差,因为每次写操作都必然涉及一次数据库写入。通常需要成熟的缓存中间件支持。

策略三:Write-Behind Pattern(异步写回模式)

Write-Through 的异步版本。应用写入缓存后立即返回,缓存组件在之后某个时间点(例如攒够一批数据或定时)批量异步地更新到数据库。

优点:写性能极高。
缺点:有数据丢失风险(缓存宕机),一致性最弱。适用于允许少量数据丢失的场景,如计数、点赞等。

三、保证最终一致性的进阶方案

为了弥补 Cache-Aside 模式中的缺陷,我们可以引入一些额外的机制。

方案一:延迟双删

针对 Cache-Aside 中提到的“先更新数据库,再删除缓存”可能带来的并发问题,可以引入一个延迟删除。

  1. 线程 A 更新数据库。
  2. 线程 A 删除缓存。
  3. 线程 A 休眠一个特定的时间(如 500ms - 1s)
  4. 线程 A 再次删除缓存。

第二次删除是为了清理掉在第1次删除后、其他线程可能写入的旧数据。这个休眠时间需要根据业务读写耗时来估算。

优点:简单有效,能很大程度上解决并发读写导致的不一致。
缺点:降低了写入吞吐量,休眠时间难以精确设定。

方案二:通过消息队列异步删除

为了解耦和重试,可以将删除缓存的操作作为消息发送到消息队列(如 RocketMQ, Kafka)。

  1. 更新数据库。
  2. 向消息队列发送一条删除缓存的消息。
  3. 消费者消费该消息,执行删除 Redis 的操作。如果删除失败,消息会重试。

这保证了删除缓存的操作至少会被执行一次,大大提高了可靠性。

方案三:通过数据库 Binlog 同步(最优解)

这是目前最成熟、对业务侵入性最小、一致性最好的方案。其核心是利用 MySQL 的二进制日志(Binlog)进行增量数据同步。

工作原理

  1. 业务系统正常写入 MySQL。
  2. 由一个中间件(如 Canal, Debezium)伪装成 MySQL 的从库,订阅 Binlog。
  3. 中间件解析 Binlog,获取数据的变更详情(增、删、改)。
  4. 中间件根据变更,调用 Redis 的 API 来更新或删除对应的缓存。

优点

  • 业务无侵入:业务代码只关心写数据库,完全不知道缓存的存在。
  • 高性能:数据库和缓存的同步是异步的,不影响主业务链路的性能。
  • 强保证:由于基于 Binlog,它能保证只要数据库变了,缓存最终一定会被同步。顺序也与数据库一致。

缺点

  • 架构复杂,需要维护额外的同步组件。
  • 同步有毫秒级到秒级的延迟。

四、总结与最佳实践选择

策略

一致性保证

性能

复杂度

适用场景

Cache-Aside + 删除

最终一致性(有微弱不一致风险)

绝大多数场景的首选,读多写少

Cache-Aside + 延迟双删

更好的最终一致性

对一致性要求稍高,且能接受一定延迟的写操作

Write-Through

强一致性

写多读少,且对一致性要求非常高的场景

Binlog 同步

最终一致性(推荐)

大型、高要求项目的最佳实践,对业务无侵入

通用建议

  1. 首选方案:对于大多数应用,从 Cache-Aside(先更新数据库,再删除缓存) 开始。它简单、有效,在大多数情况下已经足够。
  2. 进阶保障:如果 Cache-Aside 的不一致窗口无法接受,可以引入延迟双删消息队列异步删除来增强。
  3. 终极方案:当业务发展到一定规模,对一致性和系统解耦有更高要求时,投入资源搭建基于 Binlog 的异步同步方案。这是业界证明最可靠的方案。
  4. 设置合理的过期时间:无论如何,都给 Redis 中的缓存设置一个过期时间(TTL)。这是一个安全网,即使同步逻辑出现问题,旧数据也会自动失效,最终从数据库加载新数据,保证最终一致性。
  5. 业务容忍度:最重要的是,与产品经理确认业务对一致性的容忍度。很多时候,1-2秒内的数据不一致用户是感知不到的,不需要为此付出巨大的架构和性能代价。

如果小假的内容对你有帮助,请点赞评论收藏。创作不易,大家的支持就是我坚持下去的动力!

http://www.dtcms.com/a/498738.html

相关文章:

  • 基于知识图谱(Neo4j)和大语言模型(LLM)的图检索增强(GraphRAG)的台风灾害知识问答系统(vue+flask+AI算法)
  • 短剧APP开发性能优化专项:首屏加载提速技术拆解
  • 2025年远程控制软件横评:UU远程、ToDesk、向日葵
  • 前端核心理论深度解析:从基础到实践的关键知识点
  • 合肥官方网站建设有哪些公司
  • 大模型-高效优化技术全景解析:微调 量化 剪枝 梯度裁剪与蒸馏 下
  • 微信个人号开发中如何高效实现API二次开发
  • 网页设计与网站建设实战大全wordpress文章页实现图片幻灯展现
  • Ubuntu22.04 VMware虚拟机文件拖放问题:文字复制正常但文件拖放失效
  • Vue Router 路由守卫钩子详解
  • 开源 Linux 服务器与中间件(三)服务器--Nginx
  • Java 大视界 -- Java 大数据在智能农业无人机植保作业路径规划与药效评估中的应用
  • 【OpenGL】模板测试(StencilTest)
  • 文本描述驱动的可视化工具在IDE中的应用与实践
  • C#程序实现将MySQL的存储过程转换成Oracle的存储过程
  • IDEA 中 Tomcat 部署 Java Web 项目
  • 全景网站模版校园微网站建设方案ppt模板
  • 东莞公司网站建设公司哪家好制作网站链接
  • 【Linux】Socket编程UDP
  • “桌面自动化”解救“浏览器自动化”受阻(反爬虫检测)(pywinauto、pyautogui、playwright)
  • 线程安全集合源码速读:Hashtable、Vector、Collections.synchronizedMap
  • 大文件上传与文件下载
  • React Native 项目中 WebSocket 的完整实现方案
  • 电脑建设银行怎样设置网站查询密码手机网站建设价钱是多少
  • Linux内核ida数据结构使用
  • SAP MM委外采购订单执行报表分享
  • Docker中授权普通用户使用docker命令以及解决无权限访问/var/run/docker.sock错误
  • 算法奇妙屋(八)-泰波那契数列模型
  • 荆门哪里做网站女生学建筑工程技术就业前景
  • HarmonyOS中ArkTS与Flutter数据类型对比详解