当前位置: 首页 > news >正文

MySQL MVCC 详解

MySQL MVCC 详解

维基百科上关于 MVCC 的介绍:

多版本并发控制(Multiversion concurrency control, MCC 或 MVCC),是数据库管理系统常用的一种并发控制,也用于程序设计语言实现事务内存。
MVCC意图解决读写锁造成的多个、长时间的读操作饿死写操作问题。每个事务读到的数据项都是一个历史快照,并依赖于实现的隔离级别。写操作不覆盖已有数据项,而是创建一个新的版本,直至所在操作提交时才变为可见。快照隔离使得事务看到它启动时的数据状态。

MVCC 的核心是 “数据多版本”,即同一数据在系统中可以存在多个版本,每个事务看到的数据是特定版本的快照。具体来说:

  • 读操作:无需加锁,直接读取数据的某个历史版本,避免了与写操作的冲突。
  • 写操作:只锁定当前操作的数据,不影响其他事务的读操作。

这种机制使得读写操作可以并发执行,大大提高了数据库的并发性能。

MVCC 实现机制

MySQL中,MVCC的实现基于以下基石:

隐藏字段

InnoDB 中,每一行数据除了我们定义的字段外,还会存在一些额外的隐藏列:

  • DB_TRX_ID:事务ID,表示插入或更新该行的最后一个事务的事务标识符;
  • DB_ROLL_PTR:回滚指针,回滚指针指向写入回滚段的 undo log 记录;
  • DB_ROW_ID:行ID,随着新行插入而单调增加。

事务ID

每次启动一个事务,InnoDB 会为其分配一个唯一递增的事务 ID。事务 ID 用于判断数据版本的可见性。

回滚段(Rollback Segment)与 undo 日志

当数据被修改时,InnoDB 会将旧数据复制到回滚段中,并通过DB_ROLL_PTR指针链接到 undo 日志。这些历史版本数据用于支持事务回滚和 MVCC 的读操作。

Read View(读视图)

每个读操作启动时会生成一个 Read View,包含当前活跃事务的列表。Read View 用于判断事务能看到哪些数据版本。Read View 包含以下四个关键属性:

  • creator_trx_id:当前创建 Read View 的事务 ID。用于标识生成该 Read View 的事务。
  • trx_ids:活跃事务列表,创建 Read View 时,当前所有未提交的事务 ID 列表(即活跃事务)。这些事务的修改对当前 Read View 可能不可见,需要根据规则判断。
  • low_limit_id:创建 Read View 时,系统中已分配的最大事务 ID + 1。表示大于等于该值的事务 ID 在 Read View 创建后生成,对当前 Read View 不可见。
  • low_limit_no:删除版本号:用于判断行的删除操作是否对当前事务可见(与 purge 操作相关)。核心是前三个属性。

对于读已提交事务隔离级别,在事务中每次执行查询都会重新创建一次Read View,因此可能会读取到其它事务提交的数据。
对于可重复读事务隔离级别,在事务中只会创建一次Read View,后续每次查询都使用第一次创建的Read View,因此保证了每次读取的数据都是一致的。

流程

  • 数据准备,当前事务隔离级别为 读已提交
    create table t1 (id int primary key, c2 int);
    insert into t1 values (1, 100);
    
  • 事务1
    START TRANSACTION;
    update t1 set c2 = 200 where t1 = 1;
    
  • 事务2 开启并进行查询
    START TRANSACTION;
    select * from t1 where id = 1;
    
  • 事务3
    START TRANSACTION;
    update t1 set c2 = 300 where t1 = 1;
    
  • 事务2第二次次查询
    select * from t1 where id = 1;
    
  • 事务1提交
    COMMIT;
    
  • 事务2第三次查询
    select * from t1 where id = 1;
    commit;
    

在这里插入图片描述
假设上述事务1的事务ID=120,事务2的事务ID=130,事务3的事务ID=140。

对于事务2第一次查询时,事务1先一步开启进行数据修改,并且没有提交,MVCC 的处理流程如下:

  1. 生成 Read View:
    • creator_trx_id:事务 2 的 ID = 130。
    • trx_ids:活跃事务列表,包含事务 1,为 120。
    • low_limit_id:创建 Read View 时,系统中已分配的最大事务 ID + 1 ,假定为131。
  2. 查询操作获取到最新行中的 DB_TRX_ID=120,为事务1修改
  3. 可见性判断:
    • 120 在 trx_ids 中,因此当前数据未提交,对于当前事务不可见;
    • 根据DB_ROLL_PTR查找undo log,事务ID为110,未被其它事务修改,数据可见;
  4. 因此事务2第一次查询结果为 100。

对于事务2第二次查询时,新开启了事务3修改了数据,并且也没有提交,MVCC 的处理流程如下:

  1. 生成 Read View:
    • creator_trx_id:事务 2 的 ID = 130。
    • trx_ids:活跃事务列表,包含事务1,事务3,为 120,140。
    • low_limit_id:创建 Read View 时,系统中已分配的最大事务 ID + 1,假定为141。
  2. 查询操作获取到最新行中的 DB_TRX_ID=140,为事务3修改;
  3. 可见性判断:
    • 140 在 trx_ids 中,因此当前数据未提交,对于当前事务不可见;
    • 根据DB_ROLL_PTR查找undo log,事务ID为120,仍然在 trx_ids 中,被事务1修改,对于当前事务不可见;
    • 继续根据DB_ROLL_PTR查找undo log,事务ID为110,未被其它事务修改,数据可见;
  4. 因此事务2第二次查询结果为 100。

对于事务3第三次查询时,事务1提交,事务3仍然开启,MVCC 的处理流程如下:

  1. 生成 Read View:
    • creator_trx_id:事务 2 的 ID = 130。
    • trx_ids:活跃事务列表,由于事务1已提交,因此只包含事务3,为140。
    • low_limit_id:创建 Read View 时,系统中已分配的最大事务 ID + 1,假定为141。
  2. 查询操作获取到最新行中的 DB_TRX_ID=140,为事务3修改;
  3. 可见性判断:
    • 140 在 trx_ids 中,因此当前数据未提交,对于当前事务不可见;
    • 根据DB_ROLL_PTR查找undo log,事务ID为120,事务已提交,数据可见;
  4. 因此事务2第二次查询结果为 200。
http://www.dtcms.com/a/263901.html

相关文章:

  • ChatGPT使用限额记录与插件统计
  • 杭州来未来科技 Java 实习面经
  • [C#] WPF - 自定义样式(Slider篇)
  • 【Hive SQL优化完全指南:从0.x到4.x的性能进化之路】
  • c# IO密集型与CPU密集型任务详解,以及在异步编程中的使用示例
  • [2025CVPR]DE-GANs:一种高效的生成对抗网络
  • 微分几何、旋量理论、李群李代数、黎曼度量、微分流形、SE(3)、SO(3)
  • java微服务-linux单机CPU接近100%优化
  • Jenkins × 容器技术:构建未来DevOps生态的超级引擎
  • 插入排序解析
  • C++ dll lib 以及编译链接加载的底层机制
  • 【从历史数据分析英特尔该如何摆脱困境】
  • 跨境证券交易系统合规升级白皮书:全链路微秒风控+开源替代,护航7月程序化交易新规落地
  • 手工部署与自动化部署场景模拟及参考项目
  • 数据结构与算法 第二章 线性表
  • Disruptor架构哲学
  • 【算法 day13】LeetCode 110.平衡二叉树 | 257. 二叉树的所有路径| 404.左叶子之和 |222.完全二叉树的节点个数
  • 【Python】字典get方法介绍
  • C++中的虚函数与纯虚函数
  • 【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- PaddleOCR实例化 OCR 对象的参数介绍
  • css函数写个loading动画 | css预编译scss使用
  • YOLOv11性能评估全解析:从理论到实战的指标指南
  • GitHub已破4.5w star,从“零样本”到“少样本”TTS,5秒克隆声音,冲击传统录音棚!
  • 智能客服的进化论:当服务遇见 AI 的化学反应
  • 数据结构:递归:斐波那契数列(Fibonacci Sequence)
  • Android布局管理器实战指南:从LinearLayout到ConstraintLayout的优化之旅
  • 计算机网络第十章——网络层
  • 基于Netty-WebSocket构建高性能实时通信服务
  • nginx的管理员启动,停止,重启
  • 前端处理跨域的4种方式