前言 如果我们的业务处在一个非常初级的阶段,并发程度比较低,那么我们可以几年都遇不到一次死锁问题的发生,反之,我们业务的并发程度非常高,那么时不时爆出的死锁问题肯定让我们非常挠头。





create table hero (
 id int,
 name varchar(100),
 country varchar(100),
 primary key (id),
 key idx_name (name)
) engine=innodb charset=utf8;


insert into hero values
 (1, 'l刘备', '蜀'),
 (3, 'z诸葛亮', '蜀'),
 (8, 'c曹操', '魏'),
 (15, 'x荀彧', '魏'),
 (20, 's孙权', '吴');


mysql> select * from hero;
| id | name | country |
| 1 | l刘备 | 蜀 |
| 3 | z诸葛亮 | 蜀 |
| 8 | c曹操 | 魏 |
| 15 | x荀彧 | 魏 |
| 20 | s孙权 | 吴 |
5 rows in set (0.00 sec)



我们先创建一个发生死锁的情景,在session a和session b中分别执行两个事务,具体情况如下:



  • 从第③步中可以看出,session a中的事务先对hero表聚簇索引的id值为1的记录加了一个x型正经记录锁。
  • 从第④步中可以看出,session b中的事务对hero表聚簇索引的id值为3的记录加了一个x型正经记录锁。
  • 从第⑤步中可以看出,session a中的事务接着想对hero表聚簇索引的id值为3的记录也加了一个x型正经记录锁,但是与第④步中session b中的事务加的锁冲突,所以session a进入阻塞状态,等待获取锁。
  • 从第⑥步中可以看出,session b中的事务想对hero表聚簇索引的id值为1的记录加了一个x型正经记录锁,但是与第③步中session a中的事务加的锁冲突,而此时session a和session b中的事务循环等待对方持有的锁,死锁发生,被mysql服务器的死锁检测机制检测到了,所以选择了一个事务进行回滚,并向客户端发送一条消息:

error 1213 (40001): deadlock found when trying to get lock; try restarting transaction



设计innodb的大叔给我们提供了show engine innodb status命令来查看关于innodb存储引擎的一些状态信息,其中就包括了系统最近一次发生死锁时的加锁情况。在上边例子中的死锁发生时,我们运行一下这个命令:

mysql> show engine innodb status\g
latest detected deadlock
2019-06-20 13:39:19 0x70000697e000
*** (1) transaction:
transaction 30477, active 10 sec starting index read
mysql tables in use 1, locked 1
lock wait 3 lock struct(s), heap size 1160, 2 row lock(s)
mysql thread id 2, os thread handle 123145412648960, query id 46 localhost root statistics
select * from hero where id = 3 for update
*** (1) waiting for this lock to be granted:
record locks space id 171 page no 3 n bits 72 index primary of table `dahaizi`.`hero` trx id 30477 lock_mode x locks rec but not gap waiting
record lock, heap no 3 physical record: n_fields 5; compact format; info bits 0
 0: len 4; hex 80000003; asc  ;;
 1: len 6; hex 000000007517; asc  u ;;
 2: len 7; hex 80000001d0011d; asc  ;;
 3: len 10; hex 7ae8afb8e8919be4baae; asc z   ;;
 4: len 3; hex e89c80; asc ;;

*** (2) transaction:
transaction 30478, active 8 sec starting index read
mysql tables in use 1, locked 1
3 lock struct(s), heap size 1160, 2 row lock(s)
mysql thread id 3, os thread handle 123145412927488, query id 47 localhost root statistics
select * from hero where id = 1 for update
*** (2) holds the lock(s):
record locks space id 171 page no 3 n bits 72 index primary of table `dahaizi`.`hero` trx id 30478 lock_mode x locks rec but not gap
record lock, heap no 3 physical record: n_fields 5; compact format; info bits 0
 0: len 4; hex 80000003; asc  ;;
 1: len 6; hex 000000007517; asc  u ;;
 2: len 7; hex 80000001d0011d; asc  ;;
 3: len 10; hex 7ae8afb8e8919be4baae; asc z   ;;
 4: len 3; hex e89c80; asc ;;

*** (2) waiting for this lock to be granted:
record locks space id 171 page no 3 n bits 72 index primary of table `dahaizi`.`hero` trx id 30478 lock_mode x locks rec but not gap waiting
record lock, heap no 2 physical record: n_fields 5; compact format; info bits 0
 0: len 4; hex 80000001; asc  ;;
 1: len 6; hex 000000007517; asc  u ;;
 2: len 7; hex 80000001d00110; asc  ;;
 3: len 7; hex 6ce58898e5a487; asc l  ;;
 4: len 3; hex e89c80; asc ;;

*** we roll back transaction (2)

我们只关心最近发生的死锁信息,所以就把以latest detected deadlock这一部分给单独提出来分析一下。下边我们就逐行看一下这个输出的死锁日志都是什么意思:


2019-06-20 13:39:19 0x70000697e000

这句话的意思就是死锁发生的时间是:2019-06-20 13:39:19,后边的一串十六进制0x70000697e000表示的操作系统为当前session分配的线程的线程id。


*** (1) transaction:

# 为事务分配的id为30477,事务处于active状态已经10秒了,事务现在正在做的操作就是:“starting index read”
transaction 30477, active 10 sec starting index read

# 此事务使用了1个表,为1个表上了锁(此处不是说为该表加了表锁,只要不是进行一致性读的表,都需要加锁,具体怎么加锁请看加锁语句分析或者小册章节)
mysql tables in use 1, locked 1

# 此事务处于lock wait状态,拥有3个锁结构(2个行锁结构,1个表级别x型意向锁结构,锁结构在小册中重点介绍过),heap size是为了存储锁结构而申请的内存大小(我们可以忽略),其中有2个行锁的结构
lock wait 3 lock struct(s), heap size 1160, 2 row lock(s)

# 本事务所在线程的id是2(mysql自己命名的线程id),该线程在操作系统级别的id就是那一长串数字,当前查询的id为46(mysql内部使用,可以忽略),还有用户名主机信息
mysql thread id 2, os thread handle 123145412648960, query id 46 localhost root statistics

# 本事务发生阻塞的语句
select * from hero where id = 3 for update

# 本事务当前在等待获取的锁:
*** (1) waiting for this lock to be granted:

# 等待获取的表空间id为151,页号为3,也就是表hero的primay索引中的某条记录的锁(n_bits是为了存储本页面的锁信息而分配的一串内存空间,小册中有详细介绍),该锁的类型是x型正经记录锁(rec but not gap)
record locks space id 171 page no 3 n bits 72 index primary of table `dahaizi`.`hero` trx id 30477 lock_mode x locks rec but not gap waiting

# 该记录在页面中的heap_no为2,具体的记录信息如下:
record lock, heap no 3 physical record: n_fields 5; compact format; info bits 0

# 这是主键值
0: len 4; hex 80000003; asc  ;;

# 这是trx_id隐藏列
1: len 6; hex 000000007517; asc  u ;;

# 这是roll_pointer隐藏列
2: len 7; hex 80000001d0011d; asc  ;;

# 这是name列
3: len 10; hex 7ae8afb8e8919be4baae; asc z   ;;

# 这是country列
4: len 3; hex e89c80; asc ;;

从这个信息中可以看出,session a中的事务为2条记录生成了锁结构,但是其中有一条记录上的x型正经记录锁(rec but not gap)并没有获取到,没有获取到锁的这条记录的位置是:表空间id为151,页号为3,heap_no为2。当然,设计innodb的大叔还贴心的给出了这条记录的详细情况,它的主键值为80000003,这其实是innodb内部存储使用的格式,其实就代表数字3,也就是该事务在等待获取hero表聚簇索引主键值为3的那条记录的x型正经记录锁。



*** (2) transaction:
transaction 30478, active 8 sec starting index read
mysql tables in use 1, locked 1
3 lock struct(s), heap size 1160, 2 row lock(s)
mysql thread id 3, os thread handle 123145412927488, query id 47 localhost root statistics
select * from hero where id = 1 for update

# 表示该事务获取到的锁信息
*** (2) holds the lock(s):
record locks space id 171 page no 3 n bits 72 index primary of table `dahaizi`.`hero` trx id 30478 lock_mode x locks rec but not gap
record lock, heap no 3 physical record: n_fields 5; compact format; info bits 0

# 主键值为3
0: len 4; hex 80000003; asc  ;;
1: len 6; hex 000000007517; asc  u ;;
2: len 7; hex 80000001d0011d; asc  ;;
3: len 10; hex 7ae8afb8e8919be4baae; asc z   ;;
4: len 3; hex e89c80; asc ;;

# 表示该事务等待获取的锁信息
*** (2) waiting for this lock to be granted:
record locks space id 171 page no 3 n bits 72 index primary of table `dahaizi`.`hero` trx id 30478 lock_mode x locks rec but not gap waiting
record lock, heap no 2 physical record: n_fields 5; compact format; info bits 0

# 主键值为1
0: len 4; hex 80000001; asc  ;;
1: len 6; hex 000000007517; asc  u ;;
2: len 7; hex 80000001d00110; asc  ;;
3: len 7; hex 6ce58898e5a487; asc l  ;;
4: len 3; hex e89c80; asc ;;

从上边的输出可以看出来,session b中的事务获取了hero表聚簇索引主键值为3的记录的x型正经记录锁,等待获取hero表聚簇索引主键值为1的记录的x型正经记录锁(隐含的意思就是这个hero表聚簇索引主键值为1的记录的x型正经记录锁已经被session a中的事务获取到了)。


*** we roll back transaction (2)

最终innodb存储引擎决定回滚第2个事务,也就是session b中的那个事务。



本例中,发现session a发生阻塞的语句是:

select * from hero where id = 3 for update

session b发生阻塞的语句是:

select * from hero where id = 1 for update



从死锁日志中可以看出来,session a获取了hero表聚簇索引id值为1的记录的x型正经记录锁(这其实是从session b正在等待的锁中获取的),查看session a中的语句,发现是下边这个语句造成的(对照着语句加锁分析那三篇文章):

select * from hero where id = 1 for update;

还有session b获取了hero表聚簇索引id值为3的记录的x型正经记录锁,查看session b中的语句,发现是下边这个语句造成的(对照着语句加锁分析那三篇文章):

select * from hero where id = 3 for update;

然后看session a正在等待hero表聚簇索引id值为3的记录的x型正经记录锁,这个是由于下边这个语句造成的:

select * from hero where id = 3 for update;

然后看session b正在等待hero表聚簇索引id值为1的记录的x型正经记录锁,这个是由于下边这个语句造成的:

select * from hero where id = 1 for update;


