Redis持久化深入详解
1、概述
redis 是内存数据库,如果不能将内存中的数据保存到磁盘中,那么一旦服务器进程退出,服务器的数据库数据也会消失,所以redis提供了持久化的功能,redis分为两种持久化方式:rdb和aof。有以下几个特点:
1.rdb持久化方式能够在指定的时间间隔能对你的数据进行快照存储。
2.aof持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,aof命令以redis协议追加保存每次写的操作到文件末尾。redis还能对aof文件后台重写,使得aof文件的体积不至于过大。
3.如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化的方式。
4.你也可以同时开启两种持久化方式,在这种情况下,当redis重启的时候会优先载入aof文件来恢复原始的数据。因为在通常情况下aof文件保存的数据集要比rdb文件保存的数据集要完整。
2、rdb
1、概念
在指定的时间间隔内将内存中的数据集快照写入磁盘中,它恢复的时候是将快照中的文件直接读取到内存中。
2、持久化机制-bgsave
通常,会立即返回ok,redis进程会执行fork操作创建子进程,redis在fork时,父进程会继续为客户端提供服务,子进程会将数据持久化到硬盘上,然后退出。如果已经在后台执行保存或者正在运行另一个非后台保存的进程,特别是正在进行aof写入时,则会返回错误。如果使用了bgsave任务,而正在进行aof写入时,该命令将立即返回ok,并计划在下一次机会运行后台保存。阻塞只会在fork阶段。
客户端可以使用lastsave命令检查操作是否成功。
3、持久化机制-save
不会接受客户端执行的操作命令,等持久化工作完成之后,会将新的文件替换旧的文件。
4、持久化机制-自动触发
在redis.conf
中可以配置,让用户自定义save
属性,让服务器每一段时间内执行一次bgsave
操作。
# 服务器在900秒内,对数据库进行了至少1次修改 save 900 1 # 服务器在300秒内,对数据库进行了至少10次修改 save 300 10 # 服务器在60秒内,对数据库进行了至少10000次修改 save 60 10000 # bgsave发生错误时是否停止写入,一般为yes stop-writes-on-bgsave-error yes # 持久化时是否使用lzf压缩字符串对象? rdbcompression yes # 是否对rdb文件进行校验和检验,通常为yes rdbchecksum yes # rdb持久化文件名 dbfilename dump.rdb # 持久化文件存储目录 dir ./
5、恢复数据机制
只需要将rdb文件放在我们redis启动目录就可以了,redis启动的时候会自动检查文件并恢复其中的数据。
6、优点
- rdb是一个非常紧凑的文件,它保存了某个时间点得数据集,非常适用于数据集的备份,比如你可以在每个小时报保存一下过去24小时内的数据,同时每天保存过去30天的数据,这样即使出了问题你也可以根据需求恢复到不同版本的数据集。
- rdb是一个紧凑的单一文件,很方便传送到另一个远端数据中心或者亚马逊的s3(可能加密),非常适用于灾难恢复。
- rdb在保存rdb文件时父进程唯一需要做的就是fork出一个子进程,接下来的工作全部由子进程来做,父进程不需要再做其他io操作,所以rdb持久化方式可以最大化redis的性能。
- 与aof相比,在恢复大的数据集的时候,rdb方式会更快一些。
7、缺点
- 如果你希望在redis意外停止工作(例如电源中断)的情况下丢失的数据最少的话,那么rdb不适合你。虽然你可以配置不同的save时间点(例如每隔5分钟并且对数据集有100个写的操作),是redis要完整的保存整个数据集是一个比较繁重的工作,你通常会每隔5分钟或者更久做一次完整的保存,万一在redis意外宕机,你可能会丢失几分钟的数据。
- rdb 需要经常fork子进程来保存数据集到硬盘上,当数据集比较大的时候,fork的过程是非常耗时的,可能会导致redis在一些毫秒级内不能响应客户端的请求。如果数据集巨大并且cpu性能不是很好的情况下,这种情况会持续1秒,aof也需要fork,但是你可以调节重写日志文件的频率来提高数据集的耐久度。
3、aof
1、概念
以日志的形式来记录每个写操作,将redis执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话就会根据日志文件的内容将写的指令从前到后执行一次以完成数据的恢复工作。
2、持久化原理
所有操作的命令会追加在文件中。
3、开启aof持久化
# 开启aof持久化方式,默认no appendonly no # aof 持久化生成的文件名称 appendfilename "appendonly.aof" # 三种持久化机制 # appendfsync always appendfsync everysec # appendfsync no
4、三种触发持久化机制
- always
同步持久化,每次发生数据变更会被立即持久化到硬盘中,性能比较差,但是数据完整性好。
- everysec
异步操作,每秒持久化数据到硬盘一次,可能会丢失一秒的数据。
- no
从不持久化到硬盘。
5、aof文件损坏
如果 aof 文件被破坏,redis服务是启动不了的。redis本身提供了修复了工具。redis-check-aof --fix appendonly.aof
5、优点
- 根据配置不同的策略,让你选择持久化的方式。
- aof文件是一个只进行追加的日志文件,所以不需要写入seek,即使由于某些原因(磁盘空间已满,写的过程中宕机等等)未执行完整的写入命令,你也也可使用redis-check-aof工具修复这些问题。
- redis 可以在 aof 文件体积变得过大时,自动地在后台对 aof 进行重写: 重写后的新 aof 文件包含了恢复当前数据集所需的最小命令集合。 整个重写操作是绝对安全的,因为 redis 在创建新 aof 文件的过程中,会继续将命令追加到现有的 aof 文件里面,即使重写过程中发生停机,现有的 aof 文件也不会丢失。 而一旦新 aof 文件创建完毕,redis 就会从旧 aof 文件切换到新 aof 文件,并开始对新 aof 文件进行追加操作。
- aof 文件有序地保存了对数据库执行的所有写入操作,这些写入操作以 redis 协议的格式保存, 因此 aof 文件的内容非常容易被人读懂,对文件进行分析(parse)也很轻松。导出(export)aof文件也非常简单:举个例子, 如果你不小心执行了 flushall 命令, 但只要 aof 文件未被重写,那么只要停止服务器,移除 aof 文件末尾的 flushall 命令,并重启 redis,就可以将数据集恢复到 flushall 执行之前的状态。
6、缺点
- 对于相同的数据集来说,aof 文件的体积通常要大于 rdb 文件的体积。
- 根据所使用的 fsync 策略,aof 的速度可能会慢于 rdb 。 在一般情况下, 每秒 fsync 的性能依然非常高, 而关闭 fsync 可以让 aof 的速度和 rdb 一样快, 即使在高负荷之下也是如此。 不过在处理巨大的写入载入时,rdb 可以提供更有保证的最大延迟时间(latency)。
4、如何选择持久化机制
开启两种持久化方式,根据自己的业务需求针对redis进行配置的调整。
到此这篇关于redis持久化深入详解的文章就介绍到这了,更多相关redis持久化内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!