欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

MySQL行锁深入研究

程序员文章站 2022-04-19 18:02:00
...

??做项目时由于业务逻辑的需要,必须对数据表的一行或多行加入行锁,举个最简单的例子,图书借阅系统。假设 id=1 的这本书库存为 1 ,但是有 2 个人同时来借这本书,此处的逻辑为 Select restnum from book where id =1 ; -- 如果 restnum 大于 0 ,执行 upd

??做项目时由于业务逻辑的需要,必须对数据表的一行或多行加入行锁,举个最简单的例子,图书借阅系统。假设 id=1 的这本书库存为 1 ,但是有 2 个人同时来借这本书,此处的逻辑为

Select   restnum  from  book  where  id =1 ;    
-- 如果 restnum 大于 0 ,执行 update
Update   book  set restnum=restnum-1 where id=1 ;
 

问题就来了,当 2 个人同时来借的时候,有可能第一个人执行 select 语句的时候,第二个人插了进来,在第一个人没来得及更新 book 表的时候,第二个人查到数据了,其实是脏数据,因为第一个人会把 restnum 值减 1 ,因此第二个人本来应该是查到 id=1 的书 restnum 为 0 了,因此不会执行 update ,而会告诉它 id=1 的书没有库存 了,可是数据库哪懂这些,数据库只负责执行一条条 SQL 语句,它才不管中间有没有其他 sql 语句插进来,它也不知道要把一个 session 的 sql 语句执行完再执行另一个 session 的。因此会导致并发的时候 restnum 最后的结果为 -1 ,显然这是不合理的,所以,才出现锁的概念, Mysql 使用 innodb 引擎可以通过索引 对数据行加锁。以上借书的语句变为:

Begin;
Select   restnum  from  book  where  id =1  for   update ;
-- 给 id=1 的行加上排它锁且 id 有索引
Update   book  set restnum=restnum-1 where id=1 ;
Commit;?
  这样,第二个人执行到 select 语句的时候就会处于等待状态直到第一个人执行 commit 。从而保证了第二个人不会读到第一个人修改前的数据。 那这样是不是万无一失了呢,答案是否定的。看下面的例子。   跟我一步一步来,先建立表

CREATE TABLE `book` ( 
  `id` int(11) NOT NULL auto_increment, 
  `num` int(11) default NULL, 
  `name` varchar(0) default NULL, 
  PRIMARY KEY  (`id`), 
  KEY `asd` (`num`) 
) ENGINE=InnoDB  DEFAULT CHARSET=gbk
  其中 num 字段加了索引 然后插入数据,运行,

insert into book(num) values(11),(11),(11),(11),(11); 
insert into book(num) values(22),(22),(22),(22),(22);
  然后打开 2 个 mysql 控制台窗口,其实就是建立 2 个 session 做并发操作 ******************************************************************** 在第一个 session 里运行: begin; select * from book where num=11 for update; 出现结果: +----+-----+------+ | id | num | name | +----+-----+------+ | 11 |? 11 | NULL | | 12 |? 11 | NULL | | 13 |? 11 | NULL | | 14 |? 11 | NULL | | 15 |? 11 | NULL | +----+-----+------+ 5 rows in set 然后在第二个 session 里运行: begin; select * from book where num=22 for update; 出现结果: +----+-----+------+ | id | num | name | +----+-----+------+ | 16 |? 22 | NULL | | 17 |? 22 | NULL | | 18 |? 22 | NULL | | 19 |? 22 | NULL | | 20 |? 22 | NULL | +----+-----+------+ 5 rows in set 好了,到这里什么问题都没有,是吧,可是接下来问题就来了,大家请看: 回到第一个 session ,运行: update book set name='abc' where num=11; ******************************************************************************************** 问题来了, session 竟然处于等待状态 ,可是 num=11 的行不是被第一个 session 自己锁住的么,为什么不能更新呢?好了,打这里大家也许有自己的答案,先别急,再请看一下操作。 把 2 个 session 都关闭,然后运行:

delete from book where num=11 limit 3; 
delete from book where num=22 limit 3;
  其实就是把 num=11 和 22 的记录各删去 3 行, 然后重复 “***********************” 之间的操作 竟然发现,运行 update book set name='abc' where num=11; 后,有结果出现了,说明没有被锁住, 这是为什么呢,难道 2 行数据和 5 行数据,对 MySQL 来说,会产生锁行和锁表两种情况吗 。经过跟网友讨论和翻阅资料,仔细分析后发现:   在以上实验数据作为测试数据的情况下,由于 num 字段重复率太高,只有 2 个值,分别是 11 和 12. 而数据量相对于这两个值来说却是比较大的,是 10 条, 5 倍的关系。 那么 mysql 在解释 sql 的时候,会忽略索引,因为它的优化器发现:即使使用了索引,还是要做全表扫描,故而放弃了索引,也就没有使用行锁,却使用了表锁。 简单的讲,就是 MYSQL 无视了你的索引,它觉得与其行锁,还不如直接表锁,毕竟它觉得表锁所花的代价比行锁来的小。以上问题即便你使用了 force index 强制索引,结果还是一样,永远都是表锁。 所以 mysql 的行锁用起来并不是那么随心所欲的,必须要考虑索引。再看下面的例子。  
select id from items where id in (select id from items where id 
 
大部分会认为结果一样没什么区别,其实差别大了,区别就是第一条 sql 语句会产生表锁,而第二个 sql 语句是行锁,为什么呢?因为第一个 sql 语句用了子查询外围查询故而没使用索引,导致表锁。
 
好了,回到借书的例子,由于 id 是唯一的,所以没什么问题,但是如果有些表出现了索引有重复值,并且 mysql 会强制使用表锁的情况,那怎么办呢?一般来说只有重新设计表结构和用新的 SQL 语句实现业务逻辑,但是其实上面借书的例子还有一种办法。请看下面代码:

Set   sql_mode=
'STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION';
Begin;
Select  restnum  from  book  where  id =1   ;  -- 取消排它锁 , 设置 restnum 为 unsigned
Update   book  set restnum=restnum-1 where id=1 ;
If(update 执行成功 )  commit;
Else   rollback;
  上面是个小技巧,通过把数据库模式临时设置为严格模式,当 restnum 被更新为 -1 的时候,由于 restnum 是 unsigned 类型的,因此 update 会执行失败,无论第二个 session 做了什么数据库操作,都会被回滚,从而确保了数据的正确性,这个目的只是为了防止并发的时候极小概率出现的 2 个 session 的 sql 语句嵌套执行导致数据脏读。当然最好的办法还是修改表结构和 sql 语句,让 MYSQL 通过索引来加行锁, MySQL 测试版本为 5.0.75-log 和 5.1.36-community