详解使用Redis SETNX 命令实现分布式锁
使用redis的 setnx 命令可以实现分布式锁,下文介绍其实现方法。
setnx命令简介
命令格式
setnx key value
将 key 的值设为 value,当且仅当 key 不存在。
若给定的 key 已经存在,则 setnx 不做任何动作。
setnx 是set if not exists的简写。
返回值
返回整数,具体为
- 1,当 key 的值被设置
- 0,当 key 的值没被设置
例子
redis> setnx mykey “hello” (integer) 1 redis> setnx mykey “hello” (integer) 0 redis> get mykey “hello” redis>
使用setnx实现分布式锁
多个进程执行以下redis命令:
setnx lock.foo <current unix time + lock timeout + 1>
如果 setnx 返回1,说明该进程获得锁,setnx将键 lock.foo 的值设置为锁的超时时间(当前时间 + 锁的有效时间)。
如果 setnx 返回0,说明其他进程已经获得了锁,进程不能进入临界区。进程可以在一个循环中不断地尝试 setnx 操作,以获得锁。
解决死锁
考虑一种情况,如果进程获得锁后,断开了与 redis 的连接(可能是进程挂掉,或者网络中断),如果没有有效的释放锁的机制,那么其他进程都会处于一直等待的状态,即出现“死锁”。
上面在使用 setnx 获得锁时,我们将键 lock.foo 的值设置为锁的有效时间,进程获得锁后,其他进程还会不断的检测锁是否已超时,如果超时,那么等待的进程也将有机会获得锁。
然而,锁超时时,我们不能简单地使用 del 命令删除键 lock.foo 以释放锁。考虑以下情况,进程p1已经首先获得了锁 lock.foo,然后进程p1挂掉了。进程p2,p3正在不断地检测锁是否已释放或者已超时,执行流程如下:
- p2和p3进程读取键 lock.foo 的值,检测锁是否已超时(通过比较当前时间和键 lock.foo 的值来判断是否超时)
- p2和p3进程发现锁 lock.foo 已超时
- p2执行 del lock.foo命令
- p2执行 setnx lock.foo命令,并返回1,即p2获得锁
- p3执行 del lock.foo命令将p2刚刚设置的键 lock.foo 删除(这步是由于p3刚才已检测到锁已超时)
- p3执行 setnx lock.foo命令,并返回1,即p3获得锁
- p2和p3同时获得了锁
从上面的情况可以得知,在检测到锁超时后,进程不能直接简单地执行 del 删除键的操作以获得锁。
为了解决上述算法可能出现的多个进程同时获得锁的问题,我们再来看以下的算法。
我们同样假设进程p1已经首先获得了锁 lock.foo,然后进程p1挂掉了。接下来的情况:
1、进程p4执行 setnx lock.foo 以尝试获取锁
2、由于进程p1已获得了锁,所以p4执行 setnx lock.foo 返回0,即获取锁失败
3、p4执行 get lock.foo 来检测锁是否已超时,如果没超时,则等待一段时间,再次检测
4、如果p4检测到锁已超时,即当前的时间大于键 lock.foo 的值,p4会执行以下操作
getset lock.foo <current unix timestamp + lock timeout + 1>
5、由于 getset 操作在设置键的值的同时,还会返回键的旧值,通过比较键 lock.foo 的旧值是否小于当前时间,可以判断进程是否已获得锁
6、假如另一个进程p5也检测到锁已超时,并在p4之前执行了 getset 操作,那么p4的 getset 操作返回的是一个大于当前时间的时间戳,这样p4就不会获得锁而继续等待。注意到,即使p4接下来将键 lock.foo 的值设置了比p5设置的更大的值也没影响。
另外,值得注意的是,在进程释放锁,即执行 del lock.foo 操作前,需要先判断锁是否已超时。如果锁已超时,那么锁可能已由其他进程获得,这时直接执行 del lock.foo 操作会导致把其他进程已获得的锁释放掉。
程序代码
用以下python代码来实现上述的使用 setnx 命令作分布式锁的算法。
lock_timeout = 3 lock = 0 lock_timeout = 0 lock_key = 'lock.foo' # 获取锁 while lock != 1: now = int(time.time()) lock_timeout = now + lock_timeout + 1 lock = redis_client.setnx(lock_key, lock_timeout) if lock == 1 or (now > int(redis_client.get(lock_key))) and now > int(redis_client.getset(lock_key, lock_timeout)): break else: time.sleep(0.001) # 已获得锁 do_job() # 释放锁 now = int(time.time()) if now < lock_timeout: redis_client.delete(lock_key)
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。