Redis 学习笔记(十)redis持久化
关于持久化的相关配置已在上一章笔记中介绍了,本章不再赘述。
一、redis持久化概述
由于Redis的数据都存放在内存中,如果没有配置持久化,redis重启后数据就全丢失了,于是需要开启redis的持久化功能,将数据保存到磁盘上,当redis重启后,可以从磁盘中恢复数据。
redis提供两种方式进行持久化:
- 一种是RDB持久化(原理是将Reids在内存中的数据库记录定时dump到磁盘上的RDB持久化)
- 一种是AOF(append only file)持久化(原理是将Reids的操作日志以追加的方式写入文件)。
二、RDB持久化
在指定时间间隔内将内存中数据集快照写入rdb文件,redis重启恢复时将快照文件直接读取到内存中。
redis单独创建一个子进程进行持久化,先将内存数据写入临时文件中,等持久化过程结束后,将临时文件替换掉原文件。此过程中,主进程不进行IO操作,确保性能。
rdb的缺点是最后一次持久化后的数据可能会丢失,若对数据恢复的完整性不敏感,采用rdb比aof更高效。Redis默认使用rdb持久化,一般情况下不需要修改配置。
持久化触发机制
1、save配置的规则满足的情况下,会自动触发rdb规则
2、执行flushall命令时,会触发rdb规则
3、退出redis时,也会触发rdb规则(但kill进程不会备份)
恢复rdb文件
只需将.rdb文件放到redis启动目录下就可以在redis启动时自动检查dump.rdb并恢复数据。
查看redis目录命令:
config get dir
rdb的优缺点
RDB存在哪些优势:
1). 一旦采用该方式,那么你的整个Redis数据库将只包含一个文件,这对于文件备份而言是非常完美的。比如,你可能打算每个小时归档一次最近24小时的数据,同时还要每天归档一次最近30天的数据。通过这样的备份策略,一旦系统出现灾难性故障,我们可以非常容易的进行恢复。
2). 对于灾难恢复而言,RDB是非常不错的选择。因为我们可以非常轻松的将一个单独的文件压缩后再转移到其它存储介质上。
3). 性能最大化。对于Redis的服务进程而言,在开始持久化时,它唯一需要做的只是fork出子进程,之后再由子进程完成这些持久化的工作,这样就可以极大的避免服务进程执行IO操作了。
4). 相比于AOF机制,如果数据集很大,RDB的启动效率会更高。
RDB又存在哪些劣势:
1). 如果你想保证数据的高可用性,即最大限度的避免数据丢失,那么RDB将不是一个很好的选择。因为系统一旦在定时持久化之前出现宕机现象,此前没有来得及写入磁盘的数据都将丢失。
2). 由于RDB是通过fork子进程来协助完成数据持久化工作的,因此,如果当数据集较大时,可能会导致整个服务器停止服务几百毫秒,甚至是1秒钟。
三、AOF持久化
AOF持久化以日志的形式记录服务器所处理的每一个写、删除操作,但查询操作不会记录,以文本的方式记录,可以打开文件看到详细的操作记录。
redis默认不开启AOF。修改redis.conf文件中的配置 appendonly no 为 yes,重启redis后生效。
aof文件破坏后修复
如果不小心将appendonly.aof文件破坏了,会导致redis无法启动!这事可以使用命令进行恢复:
redis-check-aof --fix appendonly.aof
但是文件中出现问题的数据会丢失。
aof的优缺点
AOF的优势有哪些:
1). 该机制可以带来更高的数据安全性,即数据持久性。Redis中提供了3种同步策略,即每秒同步、每修改同步和不同步。事实上,每秒同步也是异步完成的,其效率也是非常高的,所差的是一旦系统出现宕机现象,那么这一秒钟之内修改的数据将会丢失。而每修改同步,我们可以将其视为同步持久化,即每次发生的数据变化都会被立即记录到磁盘中。可以预见,这种方式在效率上是最低的。
2). 由于该机制对日志文件的写入操作采用的是append模式,因此在写入过程中即使出现宕机现象,也不会破坏日志文件中已经存在的内容。然而如果我们本次操作只是写入了一半数据就出现了系统崩溃问题,不用担心,在Redis下一次启动之前,我们可以通过redis-check-aof工具来帮助我们解决数据一致性的问题。
3). 如果日志过大,Redis可以自动启用rewrite机制。即Redis以append模式不断的将修改数据写入到老的磁盘文件中,同时Redis还会创建一个新的文件用于记录此期间有哪些修改命令被执行。因此在进行rewrite切换时可以更好的保证数据安全性。
4). AOF包含一个格式清晰、易于理解的日志文件用于记录所有的修改操作。事实上,我们也可以通过该文件完成数据的重建。
AOF的劣势有哪些:
1). 对于相同数量的数据集而言,AOF文件通常要大于RDB文件。RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。
2). 根据同步策略的不同,AOF在运行效率上往往会慢于RDB。总之,每秒同步策略的效率是比较高的,同步禁用策略的效率和RDB一样高效。
上一篇: Redis发布订阅模式
下一篇: elasticsearch安装