当前位置: 首页 > news >正文

mysql的mvcc

一、什么是MVCC

MySQL 的 MVCC(Multi-Version Concurrency Control,多版本并发控制) 是 InnoDB 存储引擎实现高并发事务的核心机制之一。它通过为每行数据维护多个版本,避免读写冲突,实现“读不阻塞写,写不阻塞读”,从而提高数据库的并发性能。

二、MVCC是如何实现的

MVCC 在 InnoDB 里的实现 = 隐藏字段(行级元数据) + Undo Log(存储旧版本) + Read View(快照判定) + Purge(垃圾回收)

1.当前读和快照读

快照读:即读取数据是从快照中获取的,事务在进行事务读取时不上锁,这就是mysql并发读写性能高的原因之一。 而当前读反之,读取数据时会上锁,这也就意味着即使你的隔离级别是可重复读,你用当前读也能读取到其他事务的最新结果,造成不可重复读。(mysql5.1之后的版本)

当前读:

  • 读取的是最新提交的数据,并且会加锁(共享锁或排他锁)。(mysql5.1之前InnoDB的默认方式)
  • 常见的当前读操作包括:
    • SELECT ... FOR UPDATE(加排他锁)
    • SELECT ... LOCK IN SHARE MODE(加共享锁)
    • UPDATEDELETEINSERT等操作

2. undo.log概念扫盲(撤销日志)

undo.log 用于记录数据修改前的状态,以便在事务回滚或需要读取历史版本时恢复数据。

每条记录修改前,系统会将旧值写入 undo.log,形成一条版本链。

3.readView(读视图)

readview 定义了事务在某一时刻对数据库的可见性视图,决定哪些数据版本对当前事务可见。

  • 已提交事务:已提交事务中记录的则是已经被提交的事务id集合。
  • 活跃事务:这个则记录那些还能活动且还没被提交的事务,其中min_trx_id指向活跃事务的最小值。
  • 未开始事务:这里面则是存放待使用的事务id值,其中max_trx_id就是记录这一块的最小值。
  • creator_trx_id:创建该 readview 的事务ID

4.可重复读(Repeatable Read)与读已提交(Read Committed)的区别

可重复读(Repeatable Read)--事务开始时快照
  • 在同一事务中多次读取同一数据时,保证结果一致,即使其他事务修改了该数据并提交。
  • 通过多版本并发控制(MVCC)实现,事务开始时创建一个快照,后续读取基于该快照。
  • 可能遇到幻读(Phantom Read)问题,即其他事务插入新数据并提交后,当前事务再次查询可能看到新数据。
读已提交(Read Committed)---每次查询时最新快照
  • 在同一事务中多次读取同一数据时,每次读取都能看到其他事务已提交的最新修改。
  • 仅保证不会读取到未提交的数据,但无法保证多次读取结果一致。
  • 通过MVCC或行级锁实现,每次查询时获取最新的已提交数据版本。
  • 可能遇到不可重复读(Non-repeatable Read)问题,即其他事务修改数据并提交后,当前事务再次查询可能看到不同结果。

关键差异

  • 一致性保证:可重复读保证同一事务内读取一致性;读已提交仅保证单次读取的已提交数据。
  • 隔离级别问题:可重复读可能幻读;读已提交可能不可重复读。
  • 实现方式:两者均可用MVCC实现,但快照生成策略不同(可重复读使用事务开始时快照,读已提交使用每次查询时最新快照)。

适用场景

  • 可重复读:需要事务内数据一致的场景,如财务报表生成。
  • 读已提交:对实时性要求高、允许数据变动的场景,如大多数OLTP系统。

示例数据库行为:

  • 事务A查询某行数据,事务B修改该行并提交。
    • 读已提交:事务A再次查询会看到B的修改。
    • 可重复读:事务A仍看到原始数据。

5. Purge 线程 = 垃圾回收

旧版本不能无限堆积。InnoDB 的 Purge 后台线程定期扫描 Undo Segment,
当确定某条旧记录 已无任何 Read View 需要 时,就会把它物理删除,释放页空间

http://www.dtcms.com/a/347731.html

相关文章:

  • 大语言模型应用开发——利用OpenAI函数与LangChain结合从文本构建知识图谱搭建RAG应用全流程
  • Redis全面详解:从配置入门到实战应用
  • 【前端debug调试】
  • 【Java SE】抽象类、接口与Object类
  • 从“一指禅”到盲打:如何系统提升电脑输入能力?
  • 25.深入对象
  • 联邦学习之----联邦批量归一化(FedBN)
  • 线程间Bug检测工具Canary
  • Python字符串
  • SOC估算方法-蜣螂优化算法结合极限学习
  • 1200 SCL学习笔记
  • 机器人控制基础:串级PID控制算法的参数如何整定?
  • 11.Shell脚本修炼手册---IF 条件语句的知识与实践
  • 无线数传模块保障智能立体车库多设备实时通信的可靠性
  • 二、BPMNJS简介
  • share logic in core or in example
  • 【typenum】 23 倒序存储的无符号整数(private.rs片段)
  • Linux mount 命令
  • PyInstaller将.py文件转为exe,执行文件在不同的电脑出现字体大小不一致问题原因分析及解决办法
  • Spring:IOC(控制反转 )、DI(依赖注入 )、AOP(通知类型、事务、拦截器)
  • 主流.NET 平台的NuGet 生态正在积极拥抱 AOT
  • 【84页PPT】智慧方案某著名企业某集团协同OA整体解决方案(附下载方式)
  • MySQL索引原理与优化全解析
  • 【每天一个知识点】训推一体机
  • 13.Shell脚本修炼手册---玩转 CASE 语句(应用场景与实践技巧)
  • GitHub Actions workflow最佳实践
  • 提问:温度不改变 logits 与概率的排名,为何还会影响模型输出?
  • Linux 进程间通信之System V 共享内存
  • 深入探讨集成学习:Bagging与Boosting的核心原理与实践
  • RAG系统开发中的12大痛点及应对策略