1、背景
mvcc叫做多版本并发控制,通过维护数据的多个历史版本实现读写分离:读操作访问快照版本,无需加锁,避免阻塞写操作;写操作创建新版本,不影响其它事务的读操作。
这种机制支持了读已提交和可重复读两种事务隔离级别,innodb中是通过隐藏列事务id、版本链、read view实现的mvcc。
2、设置事务的隔离级别
设置事务隔离级别可以通过修改配置文件和通过sql语句,修改的隔离级别有4种:读未提交、读已提交、可重复读、串行化,修改配置文件可以永久生效,查看配置文件中的隔离级别如下:
[root@xxx xxx]# cat /xxx/my.cnf | grep 'transaction_isolation' transaction_isolation = read-committed
通过sql语句修改是临时生效的,有3种修改方式,一个是会话级设置,只影响当前连接,例如:
mysql> set session transaction isolation level read committed; query ok, 0 rows affected (0.00 sec)
另一个是全局设置,影响所有连接,例如:
mysql> set global transaction isolation level repeatable read; query ok, 0 rows affected (0.00 sec)
最后一个是仅对下一个事务生效,例如:
mysql> set transaction isolation level read committed; query ok, 0 rows affected (0.00 sec)
3、mvcc
【1】版本链
之前讲过隐藏列:row_id、trx_id、roll_pointer,其中row_id不一定存在,当没有主键和唯一索引时,row_id才存在,trx_id是事务id,roll_pointer指向undo日志,通过roll_pointer就可以组成一条版本链,接下来通过如下表和数据来说明:
mysql> show create table student; +---------+------------------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------------+ | table | create table | +---------+------------------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------------+ | student | create table `student` ( `id` int not null auto_increment, `name` varchar(255) not null default '' comment '姓名', primary key (`id`) ) engine=innodb auto_increment=2 default charset=utf8mb4 collate=utf8mb4_0900_ai_ci | +---------+------------------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------------+ 1 row in set (0.00 sec) mysql> select * from student; +----+------+ | id | name | +----+------+ | 1 | 张三 | +----+------+ 1 row in set (0.00 sec)
接下来分别在两个事务中更新数据,假设事务id分别为20和50:
时间顺序 | 事务a,事务id=20 | 事务b,事务id=50 |
---|---|---|
t1 | 开始事务 | 开始事务 |
t2 | update student set name = ‘李四’ where id = 1; | |
t3 | 提交事务 | |
t4 | update student set name = ‘王五’ where id = 1; | |
t5 | 提交事务 |
此时版本链如下:
name为王五的代表最新记录,name为李四和张三的为undo日志。
【2】readview
- 对于未提交读的隔离级别事务来说,由于可以读到未提交事务修改的记录,直接读取最新的版本就好了;
- 对于串行化隔离级别的事务来说是使用加锁的方式来访问记录的;
- 对于读已提交和可重复读隔离级别的事务来说,只能读到已提交事务的结果。所以核心问题就是版本链中哪一个版本对当前事务是可见的,所有就有了readview,readview中包含4个部分:
名称 | 含义 |
---|---|
m_ids | 生成readview时当前系统中活跃的读写事务id列表 |
min_trx_id | m_ids中的最小值 |
max_trx_id | 分配给下一个事务的id值,不是m_ids中的最大值 |
creator_trx_id | 生成readview的事务id,只读事务中为0 |
通过readview的属性,我们就能判断对记录版本链中的哪一个版本可见,判断规则如下:
1、如果被访问版本的trx_id与readview的中的creator_trx_id相同,说明当前事务再访问自己修改的记录,所以该版本可以被当前事务访问。
2、如果被访问版本的trx_id小于readview的中的min_trx_id值,说明生成该版本的事务在当前事务之前已经提交,所以该版本可以被当前事务访问。
3、如果被访问版本的trx_id大于readview的中的max_trx_id值,表明生成该版本的事务在当前事务之后开启,所以该版本不可以被当前事务访问。
4、如果被访问的版本的trx_id在readview的min_trx_id和max_trx_id之间,需要判断trx_id是否在m_ids中,在就说明该版本的事务还是活跃的,不可以被访问;不在就说明该版本已经提交,可以被访问。
如果某个版本的数据对当前事务不可见,就顺着版本链去判断下一个版本的数据,一直到最后一个版本,如果最后一个版本也不可见,那查询结果就不包含这条记录。
【3】readview的生成时机
隔离级别 | 生成readview时机 |
---|---|
读已经提交 | 每次读取数据前都生成一个readview |
可重复读 | 第一次读取数据时生成一个readview |
4、总结
mvcc是一种数据库并发控制技术,通过维护数据的多个历史版本实现读写操作的并行化,从而提升性能并解决事务隔离性问题。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。
发表评论