Redis 数据库、键过期的实现

程序员文章站 2022-06-04 11:04:20

...

之前的文章讲解了 Redis 的数据结构，这回就可以看看作为内存数据库，Redis 是怎么存储数据的。以及键是怎么过期的。

阅读这篇文章你将会了解到：

Redis 的数据库实现
Redis 键过期的策略
数据库的实现
我们先看代码 server.h/redisServer

struct redisServer{
…

//保存 db 的数组
redisDb *db;

//db 的数量
int dbnum;

...

}
再看redisDb的代码：

typedef struct redisDb {
dict dict; / The keyspace for this DB */
dict expires; / Timeout of keys with a timeout set /
dict blocking_keys; / Keys with clients waiting for data (BLPOP)/
dict ready_keys; / Blocked keys that received a PUSH */
dict watched_keys; / WATCHED keys for MULTI/EXEC CAS /
int id; / Database ID /
long long avg_ttl; / Average TTL, just for stats */
} redisDb;
总体来说redis的 server 包含若干个（默认16个） redisDb 数据库。

Redis 是一个 k-v 存储的键值对数据库。其中字典 dict 保存了数据库中的所有键值对，这个地方叫做 keyspace 直译过来就是“键空间”。

所以我们就可以这么认为，在 redisDb 中我们使用 dict（字典）来维护键空间。

keyspace 的 kay 是数据库的 key，每一个key 是一个字符串对象。注意不是字符串，而是字符串对象。

keyspace 的 value 是数据库的 value，这个 value 可以是 redis 的，字符串对象，列表对象，哈希表对象，集合对象或者有序对象中的一种。

数据库读写操作
所以对于数据的增删改查，就是对 keyspace 这个大 map 的增删改查。

当我们执行：

redis SET mobile “13800000000”
实际上就是为 keyspace 增加了一个 key 是包含字符串“mobile”的字符串对象，value 为包含字符“13800000000”的字符串对象。

看图：

对于删改查，没啥好说的。类似java 的 map 操作，大多数程序员应该都能理解。

需要特别注意的是，再执行对键的读写操作的时候，Redis 还要做一些额外的维护动作：

维护 hit 和 miss 两个计数器。用于统计 Redis 的缓存命中率。
更新键的 LRU 时间，记录键的最后活跃时间。
如果在读取的时候发现键已经过期，Redis 先删除这个过期的键然后再执行余下操作。
如果有客户对这个键执行了 WATCH 操作，会把这个键标记为 dirty，让事务注意到这个键已经被改过。
没修改一次 dirty 会增加1。
如果服务器开启了数据库通知功能，键被修改之后，会按照配置发送通知。
键的过期实现
Redis 作为缓存使用最主要的一个特性就是可以为键值对设置过期时间。就看看 Redis 是如果实现这一个最重要的特性的？

在 Redis 中与过期时间有关的命令

EXPIRE 设置 key 的存活时间单位秒
EXPIREAT 设置 key 的过期时间点单位秒
PEXPIRE 设置 key 的存活时间单位毫秒
PEXPIREAT 设置 key 的过期时间点单位毫秒
其实这些命令，底层的命令都是由 REXPIREAT 实现的。

在 redisDb 中使用了 dict *expires，来存储过期时间的。其中 key 指向了 keyspace 中的 key（c 语言中的指针）， value 是一个 long long 类型的时间戳，标定这个 key 过期的时间点，单位是毫秒。

如果我们为上文的 mobile 增加一个过期时间。

redis PEXPIREAT mobile 1521469812000
这个时候就会在过期的字典中增加一个键值对。如下图：

对于过期的判断逻辑就很简单：

在字典 expires 中 key 是否存在。
如果 key 存在，value 的时间戳是否小于当前系统时间戳。
接下来就需要讨论一下过期的键的删除策略。

key的删除有三种策略：

定时删除，Redis定时的删除内存里面所有过期的键值对，这样能够保证内存友好，过期的key都会被删除，但是如果key的数量很多，一次删除需要CPU运算，CPU不友好。
惰性删除，只有 key 在被调用的时候才去检查键值对是否过期，但是会造成内存中存储大量的过期键值对，内存不友好，但是极大的减轻CPU 的负担。
定时部分删除，Redis定时扫描过期键，但是只删除部分，至于删除多少键，根据当前 Redis 的状态决定。
这三种策略就是对时间和空间有不同的倾向。Redis为了平衡时间和空间，采用了后两种策略惰性删除和定时部分删除。

惰性删除比较简单，不做过多介绍。主要讨论一下定时部分删除。

过期键的定时删除的策略由 expire.c/activeExpireCycle() 函数实现，server.c/serverCron() 定时的调用 activieExpireCycle() 。

activeExpireCycle 的大的操作原则是，如果过期的key比较少，则删除key的数量也比较保守，如果，过期的键多，删除key的策略就会很激进。

static unsigned int current_db = 0; /* Last DB tested. /
static int timelimit_exit = 0; / Time limit hit in previous call? /
static long long last_fast_cycle = 0; / When last fast cycle ran. */
首先三个 static 全局参数分别记录目前遍历的 db下标，上一次删除是否是超时退出的，上一次快速操作是什么时候进行的。

计算 timelimit = 1000000*ACTIVE_EXPIRE_CYCLE_SLOW_TIME_PERC/server.hz/100; 可以理解为 25% 的 cpu 时间。

如果 db 中 expire 的大小为0 不操作

expire 占总 key 小于 1% 不操作

num = dictSize(db->expires)；num 是 expire 使用的key的数量。

slots = dictSlots(db->expires); slots 是 expire 字典的尺寸大小。

已使用的key（num）大于 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP 则设置为 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP。也就是说每次只检查 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP 个键。

随机获取带过期的 key。计算是否过期，如果过期就删除。

然后各种统计，包括删除键的次数，平均过期时间。

每遍历十六次，计算操作时间，如果超过 timelimit 结束返回。

如果删除的过期键大于 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP 的 1\4 就跳出循环，结束。

步骤比较复杂，总结一下：（这里都是以默认配置描述）

redis 会用最多 25% 的 cpu 时间处理键的过期。
遍历所有的 redisDb
在每个 redisDb 中如果数据中没有过期键或者过期键比例过低就直接进入下一个 redisDb。
否则，遍历 redisDb 中的过期键，如果删除的键达到有过期时间的的key 的25% ，或者操作时间大于 cpu 时间的 25% 就结束当前循环，进入下一个redisDb。
后记
这篇文章主要解释了 Redis 的数据库是怎么实现的，同时介绍了 Redis 处理过期键的逻辑。看 Redis 的代码越多越发现，实际上 Redis 一直在做的一件事情就是平衡，一直在平衡程序的空间和时间。其实平时的业务设计，就是在宏观上平衡，平衡宏观系统的时间和空间。所以，看源码是让我们从微观学习系统架构的良好途径，是架构师的成长的必经之路。

我之前的三篇关于 Redis 的基础数据结构链接地址，欢迎大家阅读。

Redis 的基础数据结构（一）可变字符串、链表、字典

Redis 的基础数据结构（二）整数集合、跳跃表、压缩列表

Redis 的基础数据结构（三）对象

上一篇： [redis] 数据库相关 -- 过期键的删除策略

下一篇：揭秘：薄皇后是因为什么被废？

Redis 数据库、键过期的实现

redis lua脚本实战秒杀和减库存的实现

Redis实现分布式锁的方法示例

redis执行lua脚本的实现方法

Redis中实现查找某个值的范围

redis实现加锁的几种方法示例详解

redis客户端实现高可用读写分离的方式详解

yii实现的wap端，每刷新一次，那么按返回键时，则多返回一次

Python3实现连接SQLite数据库的方法

php实现比较全的数据库操作类

workerman 怎么实现mysql数据库里面的一个表一旦有新的数据的加入，就把新的数据发送到前端？