浅谈Redis 缓存的三大问题及其解决方案
redis 经常用于系统中的缓存,这样可以解决目前 io 设备无法满足互联网应用海量的读写请求的问题。
一、缓存穿透
缓存穿透是指缓存和数据库中都没有的数据,而用户不断发起请求,如发起 id 为-1 的数据或者特别大的不存在的数据。有可能是黑客利用漏洞攻击从而去压垮应用的数据库。
1. 常见解决方案
对于缓存穿透问题,常见的解决方案有以下三种:
- 验证拦截:接口层进行校验,如鉴定用户权限,对 id 之类的字段做基础的校验,如 id<=0 的字段直接拦截;
- 缓存空数据:当数据库查询到的数据为空时,也将这条数据进行缓存,但缓存的有效性设置得要较短,以免影响正常数据的缓存;
copypublic student getstudentsbyid(long id) { // 从redis中获取学生信息 student student = redistemplate.opsforvalue() .get(string.valueof(id)); if (student != null) { return student; } // 从数据库查询学生信息,并存入redis student = studentdao.selectbystudentid(id); if (student != null) { redistemplate.opsforvalue() .set(string.valueof(id), student, 60, timeunit.minutes); } else { // 即使不存在,也将其存入缓存中 redistemplate.opsforvalue() .set(string.valueof(id), null, 60, timeunit.seconds); } return student; }
使用布隆过滤器:布隆过滤器是一种比较独特数据结构,有一定的误差。当它指定一个数据存在时,它不一定存在,但是当它指定一个数据不存在时,那么它一定是不存在的。
2. 布隆过滤器
布隆过滤器是一种比较特殊的数据结构,有点类似与 hashmap,在业务中我们可能会通过使用 hashmap 来判断一个值是否存在,它可以在 o(1)时间复杂度内返回结果,效率极高,但是受限于存储容量,如果可能需要去判断的值超过亿级别,那么 hashmap 所占的内存就很可观了。
而 bloomfilter 解决这个问题的方案很简单。首先用多个 bit 位去代替 hashmap 中的数组,这样的话储存空间就下来了,之后就是对 key 进行多次哈希,将 key 哈希后的值所对应的 bit 位置为 1。
当判断一个元素是否存在时,就去判断这个值哈希出来的比特位是否都为 1,如果都为 1,那么可能存在,也可能不存在(如下图 f)。但是如果有一个 bit 位不为 1,那么这个 key 就肯定不存在。
注意:bloomfilter 并不支持删除操作,只支持添加操作。这一点很容易理解,因为你如果要删除数据,就得将对应的 bit 位置为 0,但是你这个 key 对应的 bit 位可能其他的 key 也对应着。
3. 缓存空数据与布隆过滤器的比较
上面对这两种方案都进行了简单的介绍,缓存空数据与布隆过滤器都能有效解决缓存穿透问题,但使用场景有着些许不同;
- 当一些恶意攻击查询查询的 key 各不相同,而且数量巨多,此时缓存空数据不是一个好的解决方案。因为它需要存储所有的 key,内存空间占用高。并且在这种情况下,很多 key 可能只用一次,所以存储下来没有意义。所以对于这种情况而言,使用布隆过滤器是个不错的选择;
- 而对与空数据的 key 数量有限、key 重复请求效率较高的场景而言,可以选择缓存空数据的方案。
二、缓存击穿
缓存击穿是指当前热点数据存储到期时,多个线程同时并发访问热点数据。因为缓存刚过期,所有并发请求都会到数据库中查询数据。
解决方案
- 将热点数据设置为永不过期;
- 加互斥锁:互斥锁可以控制查询数据库的线程访问,但这种方案会导致系统的吞吐量下降,需要根据实际情况使用。
copypublic string get(key) { string value = redis.get(key); if (value == null) { // 代表缓存值过期 // 设置3min的超时,防止del操作失败的时候,下次缓存过期一直不能 load db if (redis.setnx(key_mutex, 1, 3 * 60) == 1) { // 代表设置成功 value = db.get(key); redis.set(key, value, expire_secs); redis.del(key_mutex); } else { // 这个时候代表同时候的其他线程已经load db并回设到缓存了,这时候重试获取缓存值即可 sleep(50); get(key); // 重试 } } else { return value; } }
三、缓存雪崩
缓存雪崩发生有几种情况,比如大量缓存集中在或者缓存同时在大范围中失效,出现了大量请求去访问数据库,从而导致 cpu 和内存过载,甚至停机。
一个简单的雪崩过程:
- redis 集群产生了大面积故障;
- 缓存失败,此时仍有大量请求去访问 redis 缓存服务器;
- 在大量 redis 请求失败后,这些请求将会去访问数据库;
- 由于应用的设计依赖于数据库和 redis 服务,很快就会造成服务器集群的雪崩,最终导致整个系统的瘫痪。
解决方案
- 【事前】高可用缓存:高可用缓存是防止出现整个缓存故障。即使个别节点,机器甚至机房都关闭,系统仍然可以提供服务,redis 哨兵(sentinel) 和 redis 集群(cluster) 都可以做到高可用;
- 【事中】缓存降级(临时支持):当访问次数急剧增加导致服务出现问题时,我们如何确保服务仍然可用。在国内使用比较多的是 hystrix,它通过熔断、降级、限流三个手段来降低雪崩发生后的损失。只要确保数据库不死,系统总可以响应请求,每年的春节 12306 我们不都是这么过来的吗?只要还可以响应起码还有抢到票的机会;
- 【事后】redis 备份和快速预热:redis 数据备份和恢复、快速缓存预热。
到此这篇关于浅谈redis 缓存的三大问题及其解决方案的文章就介绍到这了,更多相关redis 缓存问题内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
上一篇: 豆瓣酱拆开冰箱能放多久
下一篇: 升级完成!腾讯恢复微信新用户注册