什么是分布式锁
引入
问: 多线程并发的时候,如何实现对共享资源安全的访问
答:通过锁来实现
问:单机多进程多线程的时候,如何实现对共享资源安全的访问
答:通过共享内存、管道等实现
问: 多机多进程的时候,如何实现对共享资源安全的访问
答:通过分布式锁
这里我通过redis
实现分布式锁
如何用redis实现分布式锁
先来了解分布式锁实现的三个核心要素
- 加锁
最简单的方法是使用setnx
命令。key
是锁的唯一标识,按照业务来决定命名。比如想要给一种商品的秒杀活动加锁,可以给key命名为lock_sale_商品ID
。而value设置成什么呢? 我们可以姑且设置成1。加锁的伪代码如下:
setnx(key, 1)
当一个线程执行setnx
返回1,说明key
原本不存在,该线程成功得到了锁;当一个线程执行setnx
返回0,说明key
原本已经存在,该线程抢锁失败
- 解锁
当得到锁的线程执行完任务,需要释放锁,以便其他线程可以进入。释放锁的最简单方式是执行del指令
,伪代码如下:
del(key)
释放锁之后,其他线程就可以继续执行setnx
命令来获取锁
- 锁超时
如果一个得到锁的线程在执行任务的过程中挂掉,来不及显示的释放锁,这块资源就会被永久的锁住,别的线程再也别想进来。
所以,setnx
的key必须设置一个超时时间,以保证即使没有被显式释放,这把锁也要在一定时间后自动释放。setnx不支持超时参数,所以需要额外的指令,伪代码如下:
expire(key, 30)
综合起来,如下:
if(setnx(key,1) == 1){
expire(key,30)
try {
do something ......
} finally {
del(key)
}
}
但是,以上伪代码存在三个致命问题
- setnx与
expire
的非原子性
设想一个极端场景,当某线程执行setnx
,成功的得到了锁
setnx
刚执行成功,还没有来得及执行expire
指令,节点1挂掉了
这样一来,这把锁就没有设置过期时间,变成死锁,别的线程再也无法获得锁了。
Redis
的setnx
命令是当key
不存在时设置key
,但setnx
不能同时完成expire
设置失效时长,不能保证setnx
和expire
的原子性。我们可以使用set
命令完成setnx
和expire
的操作,并且这种操作是原子操作。
下面是set命令的可选项:
set key value [EX seconds] [PX milliseconds] [NX|XX]
EX seconds:设置失效时长,单位秒
PX milliseconds:设置失效时长,单位毫秒
NX:key不存在时设置value,成功返回OK,失败返回(nil)
XX:key存在时设置value,成功返回OK,失败返回(nil)
案例:设置name=p7+,失效时长100s,不存在时设置
1.1.1.1:6379> set name p7+ ex 100 nx
OK
1.1.1.1:6379> get name
"p7+"
1.1.1.1:6379> ttl name
(integer) 94
这样就可以取代setnx指令。
- del导致误删
又是一个极端场景,假如某线程成功得到了锁,并且设置的超时时间是30秒。
如果某些原因导致线程 A 执行的很慢很慢,过了 30 秒都没执行完,这时候锁过期自动释放,线程 B 得到了锁。
随后,线程 A 执行完了任务,线程 A 接着执行 del
指令来释放锁。但这时候线程 B 还没执行完,线程A实际上 删除的是线程 B 加的锁。
怎么避免这种情况呢?可以在 del 释放锁之前做一个判断,验证当前的锁是不是自己加的锁。至于具体的实现,可以在加锁的时候把当前的线程 ID 当做 value,并在删除之前验证 key 对应的 value 是不是自己线程的 ID。
加锁
String threadId = Thread.currentThread().getId()
set(key,threadId ,30,NX)
解锁:
if(threadId .equals(redisClient.get(key))){
del(key)
}
但是,这样做又隐含了一个新的问题,判断和释放锁是两个独立操作,不是原子性。
解决方法: 判断和删除锁是用Lua脚本实现
String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then returnredis.call('del', KEYS[1]) else return 0 end";
redisClient.eval(lua , Collections.singletonList(key), Collections.singletonList(threadId));
- 出现并发的可能性
还是刚才第二点所描述的场景,虽然我们避免了线程 A 误删掉 key 的情况,但是同一时间有 A,B 两个线程在访问代码块,仍然是不完美的。怎么办呢?我们可以让获得锁的线程开启一个守护线程,用来给快要过期的锁“续航”。
当过去了 29 秒,线程 A 还没执行完,这时候守护线程会执行 expire 指令,为这把锁“续命”20 秒。守护线程从第 29 秒开始执行,每 20 秒执行一次。
当线程 A 执行完任务,会显式关掉守护线程。
另一种情况,如果节点 1 忽然断电,由于线程 A 和守护线程在同一个进程,守护线程也会停下。这把锁到了超时的时候,没人给它续命,也就自动释放了。
上一篇: 强网杯2019-web-随便注