当前位置: 首页 > news >正文

分布式缓存:缓存的三种读写模式及分类

文章目录

  • 缓存全景图
  • Pre
  • 缓存读写模式概述
  • 1. Cache Aside(旁路缓存)
    • 工作流程
    • 优缺点
  • 2. Read/Write Through(读写穿透)
    • 工作流程
    • 优缺点
    • 典型场景
  • 3. Write Behind Caching(异步写回)
    • 工作流程
    • 优缺点
    • 典型场景
  • 缓存分类及常用组件
    • 1. 按宿主层次分类
    • 2. 按存储介质分类
  • 场景对比与权衡
  • 小结

在这里插入图片描述


缓存全景图

在这里插入图片描述


Pre

每日一博 - 图解5种Cache策略

架构思维:缓存层场景实战_读缓存(下)


缓存读写模式概述

在业务系统中,引入缓存主要为了降低数据库压力、提升响应性能,但也带来了数据一致性和维护成本的挑战。

根据缓存和数据库的更新策略,常见有三种读写模式:

  • Cache Aside(旁路缓存)

  • Read/Write Through(读写穿透)

  • Write Behind Caching(异步缓存写入)

在这里插入图片描述

下面逐一详细介绍。


1. Cache Aside(旁路缓存)

工作流程

在这里插入图片描述

  • 写操作

    1. 应用先更新数据库
    2. 删除 Cache 中对应的 key
    3. 由数据库变更日志或下游 Trigger 驱动重新计算并回写缓存
  • 读操作

    1. 应用先查询 Cache
    2. 若未命中,则加载数据库数据
    3. 将结果写入 Cache,并返回给调用方
写 ➔ Update DB ➔ DEL cache[key] 
读 ➔ GET cache[key] ➔ Miss ➔ Query DB ➔ SET cache[key] ➔ Return

优缺点

  • 优点

    • 以数据库为准,强一致性风险低
    • 缓存回写采用延迟(Lazy)计算,可灵活处理复杂业务
  • 缺点

    • 业务端需同时维护 Cache 和 DB 访问逻辑,代码复杂度高
    • 触发缓存回写依赖日志或 Trigger,增加组件依赖

2. Read/Write Through(读写穿透)

工作流程

由缓存存储服务(Cache Service)统一代理读写,业务应用只与存储服务交互。

在这里插入图片描述

如上图,对于 Cache Aside 模式,业务应用需要同时维护 cache 和 DB 两个数据存储方,过于繁琐,于是就有了 Read/Write Through 模式。在这种模式下,业务应用只关注一个存储服务即可,业务方的读写 cache 和 DB 的操作,都由存储服务代理。存储服务收到业务应用的写请求时,会首先查 cache,如果数据在 cache 中不存在,则只更新 DB,如果数据在 cache 中存在,则先更新 cache,然后更新 DB。而存储服务收到读请求时,如果命中 cache 直接返回,否则先从 DB 加载,回种到 cache 后返回响应。

  • 写操作

    1. 存储服务查 Cache
    2. 若命中,先更新 Cache,再同步写入 DB
    3. 若未命中,仅更新 DB
  • 读操作

    1. 存储服务查 Cache
    2. 命中则直接返回
    3. 未命中则加载 DB,然后回写 Cache,再返回
写 ➔ 存储服务(GET cache) ➔ Hit: SET cache + Update DB➔ Miss: Update DB
读 ➔ 存储服务(GET cache) ➔ Miss ➔ Load DB ➔ SET cache ➔ Return

优缺点

  • 优点

    • 业务端代码只关注存储服务,隔离性好
    • 仅为“热”数据更新缓存,内存利用率高
  • 缺点

    • 写路径较 Cache Aside 更同步,写延迟略高

典型场景

  • 有明显“热”与“冷”数据区分的业务

3. Write Behind Caching(异步写回)

工作流程

由缓存存储服务(Cache Service)统一代理读写,业务应用只与存储服务交互。

在这里插入图片描述

Write Behind Caching 模式与 Read/Write Through 模式类似,也由数据存储服务来管理 cache 和 DB 的读写。不同点是,数据更新时,Read/write Through 是同步更新 cache 和 DB,而 Write Behind Caching 则是只更新缓存,不直接更新 DB,而是改为异步批量的方式来更新 DB。该模式的特点是,数据存储的写性能最高,非常适合一些变更特别频繁的业务,特别是可以合并写请求的业务,比如对一些计数业务,一条 Feed 被点赞 1万 次,如果更新 1万 次 DB 代价很大,而合并成一次请求直接加 1万,则是一个非常轻量的操作。但这种模型有个显著的缺点,即数据的一致性变差,甚至在一些极端场景下可能会丢失数据。比如系统 Crash、机器宕机时,如果有数据还没保存到 DB,则会存在丢失的风险。所以这种读写模式适合变更频率特别高,但对一致性要求不太高的业务,这样写操作可以异步批量写入 DB,减小 DB 压力。

与 Read/Write Through 相似,均由存储服务管理:

  • 写操作

    1. 只更新 Cache
    2. 存储服务后台异步批量合并写 DB
  • 读操作
    同 Read/Write Through 模式

写 ➔ 存储服务(SET cache) ➔ Async Batch Write → DB
读 ➔ GET cache ➔ Miss ➔ Load DB ➔ SET cache ➔ Return

优缺点

  • 优点

    • 写性能最高,适合超高并发、可合并请求的场景
    • 如计数类业务,将多次加操作合并为一次 DB 更新
  • 缺点

    • 数据一致性最差,且在崩溃/宕机时可能丢失未刷盘的数据

典型场景

  • 对一致性要求不高,但写入频率极高的业务
  • 如热点计数、流量统计等

我们可以看到缓存的三种读写模式各有优劣,不存在最佳模式。实际上,我们也不可能设计出一个最佳的完美模式出来,如同空间换时间、访问延迟换低成本一样,高性能和强一致性从来都是有冲突的,系统设计从来就是取舍,随处需要 trade-off。

如何根据业务场景,更好的做 trade-off,从而设计出更好的服务系统。


缓存分类及常用组件

1. 按宿主层次分类

  • 本地 Cache(进程内):

    • 组件:Guava Cache、Ehcache(嵌入模式)
    • 优势:极低延迟、零网络开销;
    • 劣势:随进程重启丢失、容量受限。
  • 进程间 Cache(同机独立进程):

    • 组件:独立部署的 Redis/Memcached 实例(与业务进程同机)
    • 优势:重启不丢数据、减少部分网络延迟;
    • 劣势:本机资源竞争,运维较复杂。
  • 远程 Cache(跨机部署):

    • 组件:集群化的 Redis/Memcached/Pika
    • 优势:容量与扩展性最佳;
    • 劣势:网络延迟与带宽瓶颈。

2. 按存储介质分类

  • 内存型缓存

    • 数据驻留内存,读写延迟微秒级;
    • 重启或崩溃后数据丢失。
    • 典型:Memcached、Redis(无 AOF/RDB 时)。
  • 持久化型缓存

    • 数据写入 SSD/RocksDB 等介质,容量大一个量级;
    • 重启不丢失,但读写延迟高出 1–2 个数量级。
    • 典型:Pika、基于 RocksDB 的缓存方案。

场景对比与权衡

  • 一致性 vs. 性能

    • Cache Aside 最强一致性,Read/Write Through 次之,Write Behind 最弱;
  • 开发与运维成本

    • Cache Aside 代码最复杂,Read/Write Through 与 Write Behind 降低业务端复杂度;
  • 响应延迟与吞吐

    • Write Behind 写性能最高,Read/Write Through 读写均衡,Cache Aside 读性能最佳。

根据业务特性(访问热点、更新频度、一致性需求),在三种模式与不同部署/存储选型中做权衡,才能打造符合需求的缓存架构。


小结

我们树立了三种缓存读写模式——Cache Aside、Read/Write Through、Write Behind Caching——及其适用场景;

  • Cache Aside:业务先读写数据库、删除缓存,通过懒加载方式在下一次读时回填缓存,确保以数据库为准。
  • Read/Write Through:所有读写请求都由缓存服务统一代理,缓存命中则读写缓存并同步数据库,未命中则回源数据库并回填缓存。
  • Write Behind Caching:写操作只更新缓存,后台异步批量合并写入数据库,以最高写吞吐换取可容忍的数据一致性降低。

在这里插入图片描述

相关文章:

  • Flume的大概简单介绍
  • AGV(自动导引车)通信协议及通信链路性能需求分析
  • 移远三款主流5G模块RM500U,RM520N,RG200U比较
  • RK3588 Opencv-ffmpeg-rkmpp-rkrga编译与测试
  • EasyRTC音视频实时通话WebP2P技术赋能的全场景实时通信解决方案
  • 力扣-最大连续一的个数
  • 力扣-将x减到0的最小操作数
  • 【时时三省】(C语言基础)对被调用函数的声明和函数原型
  • [特殊字符] GUNION SDK 接口调用方式说明(静态库 vs 动态库)
  • C/C++的OpenCV 进行图像梯度提取
  • 并发容器(Collections)
  • bi软件是什么?bi软件是做什么用的?
  • 量化研究---bigquant策略交易api研究
  • 30个性能优化方案
  • Python在自动驾驶中的多传感器融合——让智能汽车“看得更清楚”
  • Ubantu安装 Jenkins LTS
  • VR全景制作方法都有哪些?需要注意什么?
  • 9大开源AI智能体概况
  • 香港维尔利健康科技集团全面推进AI医疗落地,构建智慧健康管理新模式
  • Honeywell 05701-A-0302 单通道控制卡
  • 快速建站代理/seo入门培训学校
  • 网站建设 坚持实用原则/对网站外部的搜索引擎优化
  • 门户网站有哪些类型/百度广告多少钱
  • 申请个网站/郑州网站排名优化公司
  • 坑人网站怎么做/杭州seo网站排名优化
  • 政府网站制作费用/公司宣传软文