MVCC机制讲解

https://juejin.cn/post/7170234288041328654
2023-11-03 15:42:11

欢迎关注 MySQL 专栏 MySQL 历险记
强烈建议收藏本导航文【MySQL 历险记】MySQL 的核心特性汇总

前言

MySQL 中大名鼎鼎的 MVCC 机制想必大家都有所耳闻吧，虽然在平时 MySQL 使用过程中基本上用不到，但是面试中出场率十分高，而且作为架构师的你也是需要知道它的工作机制。那么你对 MVCC 机制了解多少呢？MVCC 机制是用来干嘛的呢？底层的工作原理是怎么样的呢？本文就带你一探究竟。

MVCC 机制是什么?

MVCC，英文全称 Multiversion Concurrency Control，多版本并发控制。简单理解，就是相当于给我们的 MySQL 数据库拍个“快照”，定格某个时刻数据库的状态。

那你可能问为什么要拍个“快照”，也就是 MVCC 机制？

还记得事务的一大特性就是隔离性，一共有 4 个隔离级别，读未提交，读已提交，可重复读，串行化。

以 MySQL InnoDB 引擎的默认隔离级别可重复读为例，可重复读指一个事务执行过程中看到的数据，一直跟这个事务启动时看到的数据是一致的。

关于事务的基本特性请移步一文带你理解 MySQL 事务核心知识点

为了保证事务启动到结束整个生命周期看到的数据是一致的, 一般有两种方案：

MySQL 对数据“读写，写写”的时候加锁，其他事务写这条数据时加上锁，其他事务读取的时候阻塞。实际上锁住一个记录，其他事务阻塞等待
MySQL 可以对事务启动的时候，对数据库拍个“快照”，那么事务运行过程中读取都从这个快照读取，不也是保证数据一致么。

第一种方案存在明显的问题，加锁会引发阻塞，从而降低数据库性能,比如三个事务abc分别更新1 2,3三个记录,a想读取1,2,3个记录后再更新，为了保证不可重复读的隔离级别，a事务需要锁住记录1,2,3才能实现业务逻辑，此时事务b，c就阻塞了。而 MySQL 设计者们采用第二种，也就是大名鼎鼎的 MVCC，它不仅能够解决不可重复读，还一定程度解决幻读的问题，因为你整个数据库快照都有了，你就知道那个时刻的数据了。

虽然说 SQL 标准定义中可重复读隔离级别下会存在幻读的现象，但是不同的数据库厂商可以基于 SQL 标准下有不同的实现，那么不同隔离级别下发生的现象也会有出入，就拿 MySQL 的可重复读隔离级别就可以一定程度保证幻读。

小结一下：

MVCC 在 MySQL InnoDB 中的实现主要是为了提高数据库并发性能，用更好的方式去处理读-写冲突，做到即使有读写冲突时，也能做到不加锁(主要在这个场景下相比于加锁有不用加锁的优势) ，非阻塞并发读，而这个读指的就是快照读 , 而非当前读。

什么是快照读和当前读？

前面提到了快照读和当前读，这又有什么不一样呢，什么样的 sql 语句算是快照读，什么样的又算是当前读呢？

快照读

快照读又叫普通读，也就是利用 MVCC 机制读取快照中的数据。不加锁的简单的 SELECT 都属于快照读，比如这样：

SELECT * FROM user WHERE ...

快照读是基于 MVCC 实现的，提高了并发的性能，降低开销
大部分业务代码中的读取都属于快照读

当前读

当前读读取的是记录的最新版本，读取时会对读取的记录进行加锁, 其他事务就有可能阻塞。加锁的 SELECT，或者对数据进行增删改都会进行当前读。比如：

SELECT * FROM user LOCK IN SHARE MODE; # 共享锁
SELECT * FROM user FOR UPDATE; # 排他锁
INSERT INTO user values ... # 排他锁
DELETE FROM user WHERE ... # 排他锁
UPDATE user SET ... # 排他锁

update、delete、insert 语句虽然没有 select, 但是它们也会先进行读取，而且只能读取最新版本。

快照读	当前读
只有select	SELECT * FROM user LOCK IN SHARE MODE;共享锁
	SELECT * FROM user FOR UPDATE; # 排他锁
	INSERT INTO user values ... # 排他锁
	DELETE FROM user WHERE ... # 排他锁
	UPDATE user SET ... # 排他锁

MVCC 机制是咋工作的呢？

前面打个比方说 MVCC 机制相当于是基于整个数据库“拍了个快照”，这时，你会说这看上去不太现实啊。如果一个库有 100G，那么我启动一个事务，MySQL 就要保存 100G 的数据出来，这个过程得多慢啊，而且也很占用空间啊，根本就不能支持几个事务啊。别急，我们现在来讲解下 MVCC 机制是如何工作的。

数据的多个版本

首先 MySQL innoDB 存储引擎需要支持一条数据可以保留多个历史版本。怎么保留呢？还记得事务日志 undo log 吗？

undo log 保存了数据的各个历史版本，用于数据的回滚，保证事务的一致性。详情查看详解 MySQL 事务日志——undo log

对于使用 InnoDB 存储引擎的数据库表，它的聚簇索引记录中都包含下面两个隐藏列：

trx_id，当一个事务对某条聚簇索引记录进行改动时，就会把该事务的事务 id 记录在 trx_id隐藏列里；
roll_pointer，每次对某条聚簇索引记录进行改动时，都会把旧版本的记录写入到 undo 日志中，然后这个隐藏列是个指针，指向每一个旧版本记录，于是就可以通过它找到修改前的记录。

InnoDB 里面每个事务有一个唯一的事务 ID，叫作 transaction id。它是在事务开始的时候向 InnoDB 的事务系统申请的，是按申请顺序严格递增的。

如上图所示，针对 id=1 的这条数据，都会将旧值放到一条 undo 日志中，就算是该记录的一个旧版本，随着更新次数的增多，所有的版本都会被 roll_pointer 属性连接成一个链表，我们把这个链表称之为版本链，根据版本链就可以找到这条数据历史的版本。

一致性视图 ReadView

利用 undo log 日志我们已经保留下了数据的各个版本，那么现在关键的问题是要读取哪个版本的数据呢？

这时就需要用到 ReadView 了，ReadView 就是事务在使用 MVCC 机制进行快照读操作时产生的一致性视图, 比如针对可重复读隔离级别，是在事务启动的时候，创建一个 ReadView, 那 ReadView 种都有哪些关键信息呢？

trx_ids: 指的是在创建 ReadView 时，当前数据库中「活跃事务」的事务 id 列表，注意是一个列表， “活跃事务”指的就是，启动了但还没提交的事务。
min_trx_id: 指的是在创建 ReadView 时，当前数据库中「活跃事务」中事务 id 最小的事务，也就是 m_ids 的最小值。
max_trx_id：这个并不是 m_ids 的最大值，而是创建 ReadView时当前数据库中应该给下一个事务的 id 值，也就是全局事务中最大的事务 id 值 + 1；
creator_trx_id ：指的是创建该 ReadView 的事务的事务 id, 只有在对表中的记录做改动时（执行 INSERT、DELETE、UPDATE 这些语句时）才会为事务分配事务 id，否则在一个只读事务中的事务 id 值都默认为 0。

对于当前事务的启动瞬间来说，读取的一个数据版本的 trx_id，有以下几种可能：

如果被访问版本的 trx_id 属性值与 ReadView 中的 creator_trx_id 值相同，意味着当前事务在访问它自己修改过的记录，所以该版本可以被当前事务访问。
如果落在绿色部分，表示这个版本是已提交的事务或者是当前事务自己生成的，这个数据是可见的；
如果落在红色部分，表示这个版本是由将来启动的事务生成的，是肯定不可见的；
如果落在黄色部分，那就包括两种情况
若数据的 trx_id 在 trx_ids 数组中，表示这个版本是由还没提交的事务生成的，不可见, 去读取这条数据的历史版本，这条数据的历史版本中都包含了事务 id 信息，去查找第一个不在活跃事务数组的版本记录。
若数据的 trx_id 不在 trx_ids 数组中，表示这个版本是已经提交了的事务生成的，可见。

这种通过版本链 + 一致性视图来控制并发事务访问同一个记录时的行为就叫 MVCC（多版本并发控制），现在你明白 MySQL 如何实现了“秒级创建快照”的能力了吧。

还是不懂？举例说明

如果你对 MVCC 机制的整个流程还是比较模糊，我们现在举例来说明下。

比如 student 表中有一个事务 id 为 8 的插入记录：

insert into student(id, name, class) values(1, '张三', '一班')

我们现在在 MySQL 的读已提交和可重复读隔离级别下，MVCC 机制的整个工作流程。

MySQL 中的读未提交和序列化并不需要 MVCC 机制，读未提交，直接读取别人未提交的数据，而序列化全程用加锁的方式，也用不上 MVCC, 大家体会下。

可重复读隔离级别下

可重复读 REPEATABLE READ 隔离级别的事务来说，只会在第一次执行查询语句时生成一个 ReadView ，之后的查询就不会重复生成了。

begin/start transaction 命令并不是一个事务的起点，在执行到它们之后的第一个操作 InnoDB 表的语句，事务才真正启动。如果你想要马上启动一个事务，可以使用 start transaction with consistent snapshot 这个命令。

事务 10	事务 20	事务 30
beginUPDATE student SET name="李四" WHERE id=1;UPDATE student SET name="王五" WHERE id=1;
	begin 更新了一些其他表的数据
		beginSELECT * FROM student WHERE id = 1;

事务 10 和 20 均未提交，现在事务 30 执行 select, 那么得到的结果是什么呢？

在执行 select 语句时会先生成一个 ReadView，ReadView 的 trx_ids 列表的内容就是 [10, 20]，min_trx_id 为 10，max_trx_id 为 21，creator_trx_id 为 0。
然后从版本链中挑选可见的记录，从图中看出，最新版本的列 name 的内容是 '王五'，该版本的 trx_id 值为 10，在 trx_ids 列表内，所以不符合可见性要求，根据 roll_pointer 跳到下一个版本。
下一个版本的列 name 的内容是 '李四'，该版本的 trx_id 值也为 10，也在 trx_ids 列表内，所以也不符合要求，继续跳到下一个版本。
下一个版本的列 name 的内容是'张三'，该版本的 trx_id 值为 8，小于 ReadView 中的 min_trx_id 值 10，说明已经提交了，那么最终返回 '张三'。