mysql的mvcc学习

程序员文章站 2022-06-14 18:56:59

...

标题MVCC(multi-version concurrency control)：多版本并发控制

优点：
MVCC在大多数情况下代替了行锁，实现了对读的非阻塞，读不加锁，读写不冲突。

缺点：
每行记录都需要额外的存储空间，需要做更多的行维护和检查工作

实现原理：
在不考虑redo log的情况下利用undo log工作的简化过程：

序号	动作
1	开启事务
2	记录数据行数据快照到undo log
3	更新数据
4	将undo log写到磁盘
5	将数据写到磁盘
6	提交事务

1)为了保证数据的持久性数据要在事务提交之前持久化
2)undo log的持久化必须在数据持久化之前，这样才能保证系统奔溃时，可以用undo log来回滚事务

innodb中的隐藏列

innodb通过undo log保存已更新的旧版本的信息快照
innodb的内部实现中为每一行数据增加了三个隐藏列用于实现MVCC

列名	长度(byte)	作用
DB_TRX_ID	6	插入或更新行的最后一个事务的事务标识符（删除视为更新，将其标记为已删除）
DB_ROLL_PTR	7	写入回滚段的撤销日志记录（若行已更新，则撤销日志记录包含在更新之前重建行内容所需的信息）
DB_ROW_ID	6	行标识（隐藏单调自增ID）

结构

数据列	…	DB_ROW_ID	DB_TRX_ID	DB_ROLL_PTR

工作过程：

MVCC只在read commited（读提交）和repeatable read（可重复读）两个隔离级别下工作。
read uncommitted总数读取最新的行数据，而不是符合当前事务版本的数据行。serialable串行化则会对所有读取的行加锁

select

innodb会根据两个条件来检查每行记录

innodb只查找版本DB_TRX_ID早于当前事务版本的数据行（行的系统版本号<=事务的系统版本号，可以确保数据行要么是在开始之前已经存在，要么是事务自身插入或修改过的）
行的删除版本号DB_ROW_PTR要么未定义未更新过，要么大于当前事务版本号。可以确保事务读取到的行，在事务开始之前未被删除

insert

innodb为新插入的每一行保存当前系统版本号为行版本号

delete
innodb为删除的每一行保存当前系统版本号作为行删除标识

update
innodb为插入一行新纪录，保存当前系统版本号作为行版本号，同时保存当前系统版本号到原来的行作为删除标识

学习网址：
http://mysql.taobao.org/monthly/
https://segmentfault.com/a/1190000012650596
https://cloud.tencent.com/developer/article/1368290

innodb使用的MVCC中结合了排它锁，实现了读的非阻塞

1、创建user

create table `user` (
    `id` bigint(20) not null auto_increment,
    `name` varchar(80) not null,
    primary key (`id`)
) engine=innodb auto_increment=1 default charset=utf8mb4;

2、开启第一个事务，插入三条数据

start transaction;
insert into user (name) values('zhangsan');
insert into user (name) values('zhangsan2');
insert into user (name) values('zhangsan3');
commit;

数据对应如下，后面两列用select是看不到的

id	name	创建时间（事务ID）	删除时间（事务ID）
1	zhangsan	1	undefined
2	zhangsan2	1	undefined
3	zhangsan3	1	undefined

3、select语句
innodb会根据以下两个条件检查每行记录，查询结果必须同时满足这两个条件
只会查询创建时间（事务ID）小于或等于当前事务ID的行，这样可以确保当前事务读取的行，要么是在事务开始前已经存在要么是事务自身插入或修改过的

删除事务ID为undefined或者删除ID大于当前事务ID的行，这样可以确保当前事务读取到的行，在当前事务开始之前未被删除

4、delete语句

innodb会为删除的每一行保存当前系统的版本号（事务ID）作为删除标识
开启第2个事务，查询user数据

start transaction;
select * from user;//v1
select * from user;//v2
commit;

当事务ID=2的事务运行到v1语句时，执行了一条插入语句，插入语句的事务递增ID为3，此时的数据库结果为：

id	name	创建时间（事务ID）	删除时间（事务ID）
1	zhangsan	1	undefined
2	zhangsan2	1	undefined
3	zhangsan3	1	undefined
4	zhangsan4	3	undefined

根据查询条件限制：只会查询创建事务ID小于或等于2的行且删除事务ID为undefined或删除事务ID大于2的行。id为4的数据在执行事务2的v2时不会被检索出来，所以v1和v2的查询结果都是：

id	name	创建时间（事务ID）	删除时间（事务ID）
1	zhangsan	1	undefined
2	zhangsan2	1	undefined
3	zhangsan3	1	undefined

如果在事务2执行到v1语句时，事务3插入了一条数据，马上开启事务4删除ID为1的行

start transaction;
delete from user where id = 1;
commit;

此时数据如下：

id	name	创建时间（事务ID）	删除时间（事务ID）
1	zhangsan	1	4
2	zhangsan2	1	undefined
3	zhangsan3	1	undefined
4	zhangsan4	3	undefined

接着执行事务ID为2事务v2,只检索创建事务ID小于当前事务ID，且删除事务ID为undefined或者大于当前事务的行，查询结果为：

id	name	创建时间（事务ID）	删除时间（事务ID）
1	zhangsan	1	4
2	zhangsan2	1	undefined
3	zhangsan3	1	undefined

5、update语句

innodb执行update，实际上就是插入了一行记录，并保存创建时间事务ID为当前事务的ID，同时将旧的行中删除时间事务ID为当前事务ID，即添加一条新数据，同时将旧的行数据标记为删除
假设在事务2执行到v1的时候，分别执行了事务3插入和事务4删除，然后接着执行事务5更新

start transaction;
update user set name='hua' where id =2;
commit;

数据结构为：

id	name	创建时间（事务ID）	删除时间（事务ID）
1	zhangsan	1	4
2	zhangsan2	1	5
3	zhangsan3	1	undefined
4	zhangsan4	3	undefined
2	hua	5	undefined

接着执行事务2的V2，结果为

id	name	创建时间（事务ID）	删除时间（事务ID）
1	zhangsan	1	4
2	zhangsan2	1	5
3	zhangsan3	1	undefined

mysql的mvcc学习

标题MVCC(multi-version concurrency control)：多版本并发控制

MVCC的机制保证了可重复读：一个事务执行过程中看到的数据，总数跟这个事务在启动时看到的数据时一致的

对一些一致性要求不高的场景和对单一数据的操作的场景可以用MVCC，比如多个事务同时更改用户在线数，如果某个事务更新失败择重新计算后重试，直至成功。这样使用MVCC会极大地提高并发数，并消除线程锁。

mysql的mvcc和理论上的mvcc实际有所差异，mysql同一时刻只允许一个事务去操作某条数据，该条数据和一条undo log记录，是悲观锁的操作方式，而真实的MVCC的定义实际是乐观锁的操作方式，某一时刻记录可以存着很多版本。

MySQL 实现双向复制的方法指南_MySQL

学习Oracle需要掌握的重要知识点

献给所有想学习正则和采集的朋友

MySQL主从复制实战-详解基于日志点的复制代码实例

Mysql迁移到Oracle前需要了解的50件事_MySQL

PHP学习之数组的定义和填充_php技巧

MySQL的一些配置有关问题

MySQL缓存查询的实际应用

MyBatis学习总结（16）Mybatis使用的几个建议

【基于C++和Python的Opencv3学习笔记之基本图形的绘制】