申明
本文章首发自本人公众号:壹枝花算不算浪漫,如若转载请标明来源!java
感兴趣的小伙伴可关注我的公众号:壹枝花算不算浪漫redis
前言
Redis是基于内存来实现的NO SQL数据库,可是我么你都知道存储在内存中的数据,只要服务器关机,内存中的数据就会消失了。算法
为了不内存中的数据丢失,Redis提供了对持久化的支持。Redis共有RDB和AOF两种持久化机制。数据库
能够先看下两种持久化机制原理: 缓存
RDB和AOF两种持久化机制的介绍
RDB持久化机制,对redis中的数据执行周期性的持久化安全
AOF机制对每条写入命令做为日志,以append-only的模式写入一个日志文件中,在redis重启的时候,能够经过回放AOF日志中的写入指令来从新构建整个数据集服务器
若是同时使用RDB和AOF两种持久化机制,那么在redis重启的时候,会使用AOF来从新构建数据,由于AOF中的数据更加完整app
RDB持久化机制的优势
-
RDB很是适合作冷备,能够将这种完整的数据文件发送到一些远程的安全存储上去,好比云服务器。异步
-
RDB对redis对外提供的读写服务,影响很是小,可让redis保持高性能,由于redis主进程只须要fork一个子进程,让子进程执行磁盘IO操做来进行RDB持久化便可性能
-
相对于AOF持久化机制来讲,直接基于RDB数据文件来重启和恢复redis进程,更加快速
RDB持久化机制的缺点
- 若是想要在redis故障时,尽量少的丢失数据,那么RDB没有AOF好。通常来讲RDB数据快照文件,都是每隔5分钟,或者更长时间生成一次,这个时候就得接受一旦redis进程宕机,那么会丢失最近5分钟的数据
- RDB每次在fork子进程来执行RDB快照数据文件生成的时候,若是数据文件特别大,可能会致使对客户端提供的服务暂停数毫秒,或者甚至数秒
AOF持久化机制的优势
- AOF能够更好的保护数据不丢失,通常AOF会每隔1秒,经过一个后台线程执行一次fsync操做,最多丢失1秒钟的数据
- AOF日志文件以append-only模式写入,因此没有任何磁盘寻址的开销,写入性能很是高,并且文件不容易破损,即便文件尾部破损,也很容易修复
- AOF日志文件即便过大的时候,出现后台重写操做,也不回影响客户端的读写。由于再rewrite log的时候,会对其中的指令进行压缩,建立一份须要恢复数据的最小日志出来。再建立新日志文件的时候,老的日志文件仍是照常写入。当新的merge后的日志文件ready的时候,再交换老日志文件便可
- AOF日志文件的命令经过很是可读的方式进行记录,这个特性很是适合作灾难性的误删除的紧急恢复。好比不当心使用flushall命令清空了全部数据,只要这个时候后台rewrite尚未发生,那么就能够当即拷贝AOF文件,将最后一条flushall命令给删除,而后再将AOF文件放回去,就能够经过恢复机制,自动恢复全部数据
AOF持久化机制的缺点
- 对于同一份数据来讲,AOF日志文件一般比RDB数据快照文件更大
- AOF开启后,支持的写QPS会比RDB支持的写QPS低,由于AOF通常会配置成每秒fsync一第二天志文件,固然,每秒一次fsync,性能也仍是很高的
RDB和AOF到底该如何选择
- 不要仅仅使用RDB,由于那样会致使丢失不少数据
- 不要仅仅使用AOF,由于这样会有问题,第一:经过AOF作冷备,没有RDB作冷备,来的恢复速度更快。第二:RDB每次简单粗暴生成数据快照,更加健壮,能够避免AOF这种复杂的备份和恢复机制的bug
- 综合使用AOF和RDB两种持久化机制,用AOF来保证数据不丢失,做为数据恢复的第一选择;用RDB来作不一样程度的冷备,在AOF文件都丢失或损坏不可用的时候,还可使用RDB来进行快速的数据恢复
RDB 配置
save 900 1
save 300 10
save 60 10000
复制代码
也能够手动调用save或者bgsave命令,同步或异步执行rdb快照生成
RDB持久化机制的工做流程
- redis根据配置本身尝试去生成rdb快照文件
- fork一个子进程出来
- 子进程尝试将数据dump到临时的rdb快照文件中
- 完成rdb快照文件的生成以后,就替换以前旧的快照文件
dump.rdb 每次生成一个新的快照,都会覆盖以前老的快照文件
AOF 持久化的配置
AOF持久化默认是关闭的,默认是打开RDB持久化配置的。
配置appendonly yes,能够打开AOF持久化
打开AOF持久化以后,redis每次接收一条写命令,就会写入日志文件中,固然是先写入os cache,而后每隔必定时间再fsync一下。
并且即便AOF和RDB都开启了,redis重启的时候也会优先选择AOF,由于AOF的数据比较完整
能够配置AOF的fsync策略,有三种策略能够选择:
- always:每次写入一条数据,当即将这个数据对应的写离职fsync到磁盘上去,性能很是差
- everysec:每秒将os cache中的数据fsync到磁盘,这个是最经常使用的,性能比较高
- no:仅仅redis负责将数据写入os cache就不须要管了,依赖os根据本身的策略将数据刷入到磁盘中
AOF rewrite
redis中的数据时有限的,不少数据可能会自动过时,可能会被用户删除,也有可能被redis用缓存清除的算法清理掉
redis中的数据会不断淘汰掉旧的数据,只有一部分经常使用的数据会自动保留在redis内存中
因此极可能以前已经被清理掉的数据,对应的写日志还停留在AOF中,AOF日志文件就一个,会不断的膨胀
因此基于上面的缘由,AOF会自动在后台每隔必定时间作rewrite操做,好比日志里已经存放了针对100w数据的写日志,而redis内存中此时只有10w数据;rewrite会基于当前内存中10w数据构建一套最新的日志到AOF中,覆盖以前的老日志
在redis.conf中,能够配置rewrite的策略:
- auto-aof-rewrite-percentage 100
- auto-aof-rewrite-min-size 64mb
大小超过64mb,且比上次增加了100%才会触发一次rewrite
具体rewrite步骤:
- redis fork一个子进程
- 子进程基于当前内存中的数据,构建日志,开始往一个新的临时AOF文件中写入日志
- redis主进程,接收到client新的写操做以后,在内存中写入日志,同时新的日志也继续写入旧的AOF文件
- 用新的日志文件替换掉旧的日志文件
AOF破损文件的修复
若是redis在append数据到AOF文件时,机器宕机了,可能会致使AOF文件破损
用redis-check-aof --fix命令来修复破损的AOF文件
AOF和RDB同时工做
- 若是RDB在执行snapshotting操做,那么redis不会执行AOF rewrite操做。若是redis在执行AOF rewrite,那么就不会执行RDB snapshotting操做
- 若是RDB在执行snapshotting,此时用户执行BGREWRITEAOF命令,那么等RDB快照生成以后,才会去执行AOF rewrite
- 同时有RDB snapshot文件和AOF日志文件,那么redis重启的时候,会优先使用AOF进行数据恢复,由于其中的日志更完整