mysql的mvcc学习
标题MVCC(multi-version concurrency control):多版本并发控制
优点:
MVCC在大多数情况下代替了行锁,实现了对读的非阻塞,读不加锁,读写不冲突。
缺点:
每行记录都需要额外的存储空间,需要做更多的行维护和检查工作
实现原理:
在不考虑redo log的情况下利用undo log工作的简化过程:
序号 | 动作 |
---|---|
1 | 开启事务 |
2 | 记录数据行数据快照到undo log |
3 | 更新数据 |
4 | 将undo log写到磁盘 |
5 | 将数据写到磁盘 |
6 | 提交事务 |
1)为了保证数据的持久性数据要在事务提交之前持久化
2)undo log的持久化必须在数据持久化之前,这样才能保证系统奔溃时,可以用undo log来回滚事务
innodb中的隐藏列
innodb通过undo log保存已更新的旧版本的信息快照
innodb的内部实现中为每一行数据增加了三个隐藏列用于实现MVCC
列名 | 长度(byte) | 作用 |
---|---|---|
DB_TRX_ID | 6 | 插入或更新行的最后一个事务的事务标识符(删除视为更新,将其标记为已删除) |
DB_ROLL_PTR | 7 | 写入回滚段的撤销日志记录(若行已更新,则撤销日志记录包含在更新之前重建行内容所需的信息) |
DB_ROW_ID | 6 | 行标识(隐藏单调自增ID) |
结构
数据列 | … | DB_ROW_ID | DB_TRX_ID | DB_ROLL_PTR |
---|
工作过程:
MVCC只在read commited(读提交) 和repeatable read(可重复读)两个隔离级别下工作。
read uncommitted总数读取最新的行数据,而不是符合当前事务版本的数据行。serialable串行化则会对所有读取的行加锁
select
innodb会根据两个条件来检查每行记录
innodb只查找版本DB_TRX_ID早于当前事务版本的数据行(行的系统版本号<=事务的系统版本号,可以确保数据行要么是在开始之前已经存在,要么是事务自身插入或修改过的)
行的删除版本号DB_ROW_PTR要么未定义未更新过,要么大于当前事务版本号。可以确保事务读取到的行,在事务开始之前未被删除
insert
innodb为新插入的每一行保存当前系统版本号为行版本号
delete
innodb为删除的每一行保存当前系统版本号作为行删除标识
update
innodb为插入一行新纪录,保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为删除标识
学习网址:
http://mysql.taobao.org/monthly/
https://segmentfault.com/a/1190000012650596
https://cloud.tencent.com/developer/article/1368290
innodb使用的MVCC中结合了排它锁,实现了读的非阻塞
1、创建user
create table `user` (
`id` bigint(20) not null auto_increment,
`name` varchar(80) not null,
primary key (`id`)
) engine=innodb auto_increment=1 default charset=utf8mb4;
2、开启第一个事务,插入三条数据
start transaction;
insert into user (name) values('zhangsan');
insert into user (name) values('zhangsan2');
insert into user (name) values('zhangsan3');
commit;
数据对应如下,后面两列用select是看不到的
id | name | 创建时间(事务ID) | 删除时间(事务ID) |
---|---|---|---|
1 | zhangsan | 1 | undefined |
2 | zhangsan2 | 1 | undefined |
3 | zhangsan3 | 1 | undefined |
3、select语句
innodb会根据以下两个条件检查每行记录,查询结果必须同时满足这两个条件
只会查询 创建时间(事务ID)小于或等于当前事务ID的行,这样可以确保当前事务读取的行,要么是在事务开始前已经存在要么是事务自身插入或修改过的
删除事务ID为undefined或者删除ID大于当前事务ID的行,这样可以确保当前事务读取到的行,在当前事务开始之前未被删除
4、delete语句
innodb会为删除的每一行保存当前系统的版本号(事务ID)作为删除标识
开启第2个事务,查询user数据
start transaction;
select * from user;//v1
select * from user;//v2
commit;
当事务ID=2的事务运行到v1语句时,执行了一条插入语句,插入语句的事务递增ID为3,此时的数据库结果为:
id | name | 创建时间(事务ID) | 删除时间(事务ID) |
---|---|---|---|
1 | zhangsan | 1 | undefined |
2 | zhangsan2 | 1 | undefined |
3 | zhangsan3 | 1 | undefined |
4 | zhangsan4 | 3 | undefined |
根据查询条件限制:只会查询创建事务ID小于或等于2的行且删除事务ID为undefined或删除事务ID大于2的行。id为4的数据在执行事务2的v2时不会被检索出来,所以v1和v2的查询结果都是:
id | name | 创建时间(事务ID) | 删除时间(事务ID) |
---|---|---|---|
1 | zhangsan | 1 | undefined |
2 | zhangsan2 | 1 | undefined |
3 | zhangsan3 | 1 | undefined |
如果在事务2执行到v1语句时,事务3插入了一条数据,马上开启事务4删除ID为1的行
start transaction;
delete from user where id = 1;
commit;
此时数据如下:
id | name | 创建时间(事务ID) | 删除时间(事务ID) |
---|---|---|---|
1 | zhangsan | 1 | 4 |
2 | zhangsan2 | 1 | undefined |
3 | zhangsan3 | 1 | undefined |
4 | zhangsan4 | 3 | undefined |
接着执行事务ID为2事务v2,只检索创建事务ID小于当前事务ID,且删除事务ID为undefined或者大于当前事务的行,查询结果为:
id | name | 创建时间(事务ID) | 删除时间(事务ID) |
---|---|---|---|
1 | zhangsan | 1 | 4 |
2 | zhangsan2 | 1 | undefined |
3 | zhangsan3 | 1 | undefined |
5、update语句
innodb执行update,实际上就是插入了一行记录,并保存创建时间事务ID为当前事务的ID,同时将旧的行中删除时间事务ID为当前事务ID,即添加一条新数据,同时将旧的行数据标记为删除
假设在事务2执行到v1的时候,分别执行了事务3插入和事务4删除,然后接着执行事务5更新
start transaction;
update user set name='hua' where id =2;
commit;
数据结构为:
id | name | 创建时间(事务ID) | 删除时间(事务ID) |
---|---|---|---|
1 | zhangsan | 1 | 4 |
2 | zhangsan2 | 1 | 5 |
3 | zhangsan3 | 1 | undefined |
4 | zhangsan4 | 3 | undefined |
2 | hua | 5 | undefined |
接着执行事务2的V2,结果为
id | name | 创建时间(事务ID) | 删除时间(事务ID) |
---|---|---|---|
1 | zhangsan | 1 | 4 |
2 | zhangsan2 | 1 | 5 |
3 | zhangsan3 | 1 | undefined |