咱们都知道Redis的数据都存在内存里,若是忽然宕机,数据就会所有丢失,所以必须有一种机制来保证Redis的数据不会由于故障而丢失,这种机制就是Redis的持久化机制。html
Redis的持久化机制主要是有两种,第一种是RDB快照,第二种是AOD日志。若是咱们的服务器开启了AOF持久化功能,那么服务器会优先使用AOF文件来还原数据库的状态。只有在AOF持久化功能处于关闭的状态的时候,服务器才能使用RDB文件来还原数据库状态。面试
RDB持久化是经过快照来实现的,在指定的时间间隔内将内存的数据集快照写入磁盘,恢复的时候就是将快照文件读取到内存中。redis
但是咱们知道Redis是单线程的,内存快照又要要求Redis进行文件IO操做,但是文件IO操做时不能使用多路复用API,这意味着咱们单线程要处理服务器上的请求,还有处理文件IO操做,显然是会拖垮服务器请求的性能。数据库
咱们是如何解决的呢,这用到了COW(Copy On Write)来实现持久化。这样有一篇关于COW比较详细。(COW奶牛!Copy On Write机制了解一下)缓存
Redis会单首创建(Fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程当中,主进程是不进行任何IO操做。这就确保了极高的性能,若是须要进行大规模数据的恢复,且对于数据恢复的完整性不是很是敏感,那么RDB方式比AOF方式更加的高效。RDB的缺点就是最后一次持久化后的数据可能丢失。(默认的RDB文件为dump.rdb)安全
子进程作数据持久化,它不会修改现有的内存数据结构,它只是对数据结构进行遍历读取,而后序列化写到磁盘中。可是父进程不同,它必须持续服务客户端请求,而后对内存数据结构进行不间断的修改。那咱们不可能对同一片内存进行操做,因此用到了写入时复制。bash
数据段是由不少操做系统的页面组合而成,当父进程对其中一个页面的数据进行修改时,会将被共享内存复制一份分离出来,而后对这个复制的页面进行修改。这时子进程相应的页面是没有变化的,仍是进程产生时那一瞬间的数据。因此才被称为快照的缘由。(具体流程对应上图操做)服务器
咱们上面也提到了RDB的操做,那么何时会触发呢?数据结构
指令触发:并发
配置文件触发:
#默认的配置以下:
save 900 1 # 900秒内有一个更改就触发
save 300 10 # 300秒内有10个更改就触发
save 60 10000 # 60秒内有10000个更改就触发
复制代码
优势:
对数据的完整性要求不高
由于主进程不进行任何的IO操做,因此对数据的大规模恢复有着极高的性能
缺点:
恢复持久化文件:
将备份文件移动至 dir 参数配置持久化文件的目录下,并将文件名改成 dbfilename 参数配置持久化参数的文件名,而后启动数据库便可恢复数据。
若 dump.rdb 文件存在异常,数据恢复将报错。可以使用命令 redis-check-dump --fix 命令对 dump.rdb 持久化文件进行修复,而后重启redis服务便可。
以独立日志的方式记录每次写命令,写入的内容直接是文本协议格式,重启时再从新执行AOF文件中的命令达到恢复数据的目的,解决了数据持久化实时性问题。
appendonly no # 默认为no不开启,改成yes为开启
复制代码
若是开启了AOF,默认的文件名是appendonly.aof,路径与RDB文件同级。
**引入重写机制背景:**AOF采用文件追加的方式,将致使文件愈来愈大,故新增重写机制。当AOF文件大小超过所设置的阈值时,Redis将启动AOF内容压缩,只保留能够恢复数据的最小指令集。
**原理:**Redis 提供了 bgrewriteaof 指令用于对 AOF 日志进行瘦身(重写)。其原理就是开辟一个子进程对内存进行遍历转换成一系列 Redis 的操做指令,序列化到一个新的 AOF 日志文件中。序列化完毕后再将操做期间发生的增量AOF 日志追加到这个新的 AOF 日志文件中,追加完毕后就当即替代旧的 AOF 日志文件了,瘦身工做就完成了。
AOF的具体工做流程:
命令的实时写入,调用到命令
全部的写入命令追加到aof_buf(缓冲区)中
AOF缓冲区根据对应的策略向硬盘作同步操做
随着AOF文件愈来愈大,须要按期对AOF文件进行重写,压缩,父进程执行fork建立子进程,由子进程根据内存快照执行AOF重写,父进行继续响应后面的命令,在子进程完成重写后,父进程再把新增的写入命令写入到新的AOF文件中
Redis服务重启,加载AOF文件进行数据恢复
主动触发:
使用bgrewriteaof
命令
被动触发:
配置文件设置,有两个参数
# 重写时,是否可使用appendfsync(接受客户端的操做),默认为no,保证数据安全性
no-appendfsync-on-rewrite no
#redis会记录上次重写AOF文件的大小,当AOF文件增长至上次重写文件的100%倍,且大小大于64MB时,触发AOF重写
#auto-aof-rewrite-percentage 用于设置相对于上次AOF文件百分比
auto-aof-rewrite-percentage 100
#auto-aof-rewrite-min-size 用于设置另外一基准值
auto-aof-rewrite-min-size 64mb
复制代码
优势:
缺点:
上面咱们也说到了AOF缓冲区会根据对应的策略向硬盘作同步操做,那么具体有哪些同步策略呢?
AOF缓冲区同步策略,经过参数appendfsync控制,具体有三个配值
选项的值 | 说明 | 其余 |
---|---|---|
always | 命令写入aof_buf后调用系统fsync操做同步到AOF文件,fsync完成后线程返回 | 每次写入都要同步AOF文件,在通常的SATA硬盘很难达到高性能 |
everysec | 命令写入aof_buf后调用系统write操做,write完成后线程返回。fsync同步操做由线程每秒调用一次(建议策略) | 默认同步策略 |
no | 命令写入aof_buf后调用系统write操做,不对AOF文件作fsync同步,同步硬盘操做由操做系统负责,一般同步周期最长30秒 | 操做系统每次同步AOF文件的周期不可控,并且会加大每次同步硬盘的数据量,虽然提高了性能,但数据安全性没法保证 |
**补充:**若是同时开启了RDB和AOF的话,咱们是优先加载AOF。由于AOF保存的数据更加完整,最多也就损失1s的数据。
AOF为何直接采用文本协议格式?
文本协议具备良好的兼容性
开启AOF后,全部写入命令都包含追加操做,直接采用协议格式,避免二次处理开销
文本协议具备可读性,方便直接修改和处理
AOF 为何把命令追加到aof_buf中
重写后的AOF文件为何能够变小?
进程内已经超时的数据再也不写入文件
旧的AOF文件含有无效命令,重写使用进程内数据直接生成,新的AOF文件只保留最终数据的写入命令
多条写命令能够合并为一个,为了防止溢出,以64个元素为界拆分为多条
《Redis设计与实现》
《Redis深度历险:核心原理与应用实践》
阿提说说