MySQL-多版本并发控制
MVCC概念
- MVCC (Multiversion Concurrency Control),多版本并发控制
- MVCC 是通过数据行的多个版本管理来实现数据库的 并发控制,使得在InnoDB的事务隔离级别下执行 一致性读 操作有了保证
- 就是为了查询正在被另一个事务更新的行,并且可以看到它们被更新之前的值,这样在做查询的时候就不用等待另一个事务释放锁
- InnoDB中有MVCC实现机制,MySQL其它的存储引擎并不支持
- MVCC本质是采用乐观锁思想的一种方式
MVCC解决问题
- 读写之间阻塞的问题。通过MVCC可以让读写互相不阻塞,即读不阻塞写,写不阻塞读,这样就可以提升事务并发处理能力
- 降低了死锁的概率。这是因为MVCC采用了乐观锁的方式,读取数据时并不需要加锁,对于写操作,也只锁定必要的行
- 解决快照读的问题。当我们查询数据库在某个时间点的快照时,只能看到这个时间点之前事务提交更新的结果,而不能看到这个时间点之后事务提交的更新结果
快照读
- 快照读又叫一致性读,读取的是快照数据。不加锁的简单 SELECT 都属于快照读,即不加锁的非阻塞读
- 快照读的实现是基于MVCC,它在很多情况下,避免了加锁操作,降低了开销。既然是基于多版本,那么快照读可能读到的并不一定是数据的最新版本,而有可能是之前的历史版本
- 快照读的前提是隔离级别不是串行级别,串行级别下的快照读会退化成当前读
当前读
- 当前读读取的是记录的最新数据,而不是历史版本的数据
- 读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁
SELECT * FROM student LOCK IN SHARE MODE; # 共享锁
SELECT * FROM student FOR UPDATE; # 排他锁
INSERT INTO student values ... # 排他锁
DELETE FROM student WHERE ... # 排他锁
UPDATE student SET ... # 排他锁
实现原理ReadView
1. 什么是ReadView
- ReadView 就是事务A在使用MVCC机制进行快照读操作时产生的读视图
- 当事务启动时,会生成数据库系统当前的一个快照,InnoDB为每个事务构造了一个数组,用来记录并维护系统当前活跃事务的ID(“活跃”指的就是,启动了但还没提交)
2. ReadView中主要包含4个比较重要的内容
- creator_trx_id :创建这个 Read View 的事务 ID,只有在对表中的记录做改动时(执行INSERT、DELETE、UPDATE这些语句时)才会为事务分配事务id,否则在一个只读事务中的事务id值都默认为0
- trx_ids :表示在生成ReadView时当前系统中活跃的读写事务的 事务id列表
- up_limit_id :活跃的事务中最小的事务 ID
- low_limit_id :表示生成ReadView时系统中应该分配给下一个事务的 id 值,系统最大的事务id
- low_limit_id并不是trx_ids中的最大值,事务id是递增分配的
- 比如,现在有id为1,2,3这三个事务,之后id为3的事务提交了。那么一个新的读事务在生成ReadView时,trx_ids就包括1和2,up_limit_id的值就是1,low_limit_id的值就是4
3. ReadView的规则
- 如果被访问版本的trx_id属性值与ReadView中的 creator_trx_id 值相同,意味着当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问
- 如果被访问版本的trx_id属性值小于ReadView中的 up_limit_id 值,表明生成该版本的事务在当前事务生成ReadView前已经提交,所以该版本可以被当前事务访问
- 如果被访问版本的trx_id属性值大于或等于ReadView中的 low_limit_id 值,表明生成该版本的事务在当前事务生成ReadView后才开启,所以该版本不可以被当前事务访问
- 如果被访问版本的trx_id属性值在ReadView的 up_limit_id 和 low_limit_id 之间,那就需要判
断一下trx_id属性值是不是在 trx_ids 列表中- 如果在,说明创建ReadView时生成该版本的事务还是活跃的,该版本不可以被访问
- 如果不在,说明创建ReadView时生成该版本的事务已经被提交,该版本可以被访问
4. MVCC整体操作流程
- 首先获取事务自己的版本号,也就是事务 ID;
- 获取 ReadView;
- 查询得到的数据,然后与 ReadView 中的事务版本号进行比较;
- 如果不符合 ReadView 规则,就需要从 Undo Log 中获取历史快照;
- 最后返回符合规则的数据
5. 读已提交和可重复读时的Read View
- 在隔离级别为读已提交(Read Committed)时,一个事务中的每一次 SELECT 查询都会重新获取一次Read View;如果 Read View 不同,就可能产生不可重复读或者幻读的情况
- 当隔离级别为可重复读的时候,就避免了不可重复读,这是因为一个事务只在第一次SELECT 的时候会获取一次 Read View,而后面所有的 SELECT 都会复用这个 Read View