欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

mysql的mvcc学习

程序员文章站 2022-06-14 18:56:59
...

标题MVCC(multi-version concurrency control):多版本并发控制

优点:
MVCC在大多数情况下代替了行锁,实现了对读的非阻塞,读不加锁,读写不冲突。

缺点:
每行记录都需要额外的存储空间,需要做更多的行维护和检查工作

实现原理:
在不考虑redo log的情况下利用undo log工作的简化过程:

序号 动作
1 开启事务
2 记录数据行数据快照到undo log
3 更新数据
4 将undo log写到磁盘
5 将数据写到磁盘
6 提交事务

1)为了保证数据的持久性数据要在事务提交之前持久化
2)undo log的持久化必须在数据持久化之前,这样才能保证系统奔溃时,可以用undo log来回滚事务

innodb中的隐藏列

innodb通过undo log保存已更新的旧版本的信息快照
innodb的内部实现中为每一行数据增加了三个隐藏列用于实现MVCC

列名 长度(byte) 作用
DB_TRX_ID 6 插入或更新行的最后一个事务的事务标识符(删除视为更新,将其标记为已删除)
DB_ROLL_PTR 7 写入回滚段的撤销日志记录(若行已更新,则撤销日志记录包含在更新之前重建行内容所需的信息)
DB_ROW_ID 6 行标识(隐藏单调自增ID)

结构

数据列 DB_ROW_ID DB_TRX_ID DB_ROLL_PTR

工作过程:

MVCC只在read commited(读提交) 和repeatable read(可重复读)两个隔离级别下工作。
read uncommitted总数读取最新的行数据,而不是符合当前事务版本的数据行。serialable串行化则会对所有读取的行加锁

select

innodb会根据两个条件来检查每行记录

innodb只查找版本DB_TRX_ID早于当前事务版本的数据行(行的系统版本号<=事务的系统版本号,可以确保数据行要么是在开始之前已经存在,要么是事务自身插入或修改过的)
行的删除版本号DB_ROW_PTR要么未定义未更新过,要么大于当前事务版本号。可以确保事务读取到的行,在事务开始之前未被删除

insert

innodb为新插入的每一行保存当前系统版本号为行版本号

delete
innodb为删除的每一行保存当前系统版本号作为行删除标识

update
innodb为插入一行新纪录,保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为删除标识

学习网址:
http://mysql.taobao.org/monthly/
https://segmentfault.com/a/1190000012650596
https://cloud.tencent.com/developer/article/1368290

innodb使用的MVCC中结合了排它锁,实现了读的非阻塞

1、创建user

create table `user` (
    `id` bigint(20) not null auto_increment,
    `name` varchar(80) not null,
    primary key (`id`)
) engine=innodb auto_increment=1 default charset=utf8mb4;

2、开启第一个事务,插入三条数据

start transaction;
insert into user (name) values('zhangsan');
insert into user (name) values('zhangsan2');
insert into user (name) values('zhangsan3');
commit;

数据对应如下,后面两列用select是看不到的

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 undefined
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined

3、select语句
innodb会根据以下两个条件检查每行记录,查询结果必须同时满足这两个条件
只会查询 创建时间(事务ID)小于或等于当前事务ID的行,这样可以确保当前事务读取的行,要么是在事务开始前已经存在要么是事务自身插入或修改过的

删除事务ID为undefined或者删除ID大于当前事务ID的行,这样可以确保当前事务读取到的行,在当前事务开始之前未被删除

4、delete语句

innodb会为删除的每一行保存当前系统的版本号(事务ID)作为删除标识
开启第2个事务,查询user数据

start transaction;
select * from user;//v1
select * from user;//v2
commit;

当事务ID=2的事务运行到v1语句时,执行了一条插入语句,插入语句的事务递增ID为3,此时的数据库结果为:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 undefined
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined
4 zhangsan4 3 undefined

根据查询条件限制:只会查询创建事务ID小于或等于2的行且删除事务ID为undefined或删除事务ID大于2的行。id为4的数据在执行事务2的v2时不会被检索出来,所以v1和v2的查询结果都是:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 undefined
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined

如果在事务2执行到v1语句时,事务3插入了一条数据,马上开启事务4删除ID为1的行

start transaction;
delete from user where id = 1;
commit;

此时数据如下:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 4
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined
4 zhangsan4 3 undefined

接着执行事务ID为2事务v2,只检索创建事务ID小于当前事务ID,且删除事务ID为undefined或者大于当前事务的行,查询结果为:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 4
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined

5、update语句

innodb执行update,实际上就是插入了一行记录,并保存创建时间事务ID为当前事务的ID,同时将旧的行中删除时间事务ID为当前事务ID,即添加一条新数据,同时将旧的行数据标记为删除
假设在事务2执行到v1的时候,分别执行了事务3插入和事务4删除,然后接着执行事务5更新

start transaction;
update user set name='hua' where id =2;
commit;

数据结构为:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 4
2 zhangsan2 1 5
3 zhangsan3 1 undefined
4 zhangsan4 3 undefined
2 hua 5 undefined

接着执行事务2的V2,结果为

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 4
2 zhangsan2 1 5
3 zhangsan3 1 undefined
MVCC的机制保证了可重复读:一个事务执行过程中看到的数据,总数跟这个事务在启动时看到的数据时一致的
对一些一致性要求不高的场景和对单一数据的操作的场景可以用MVCC,比如多个事务同时更改用户在线数,如果某个事务更新失败择重新计算后重试,直至成功。这样使用MVCC会极大地提高并发数,并消除线程锁。
mysql的mvcc和理论上的mvcc实际有所差异,mysql同一时刻只允许一个事务去操作某条数据,该条数据和一条undo log记录,是悲观锁的操作方式,而真实的MVCC的定义实际是乐观锁的操作方式,某一时刻记录可以存着很多版本。
相关标签: mvcc mysql高并发