Redis(二)、Redis持久化RDB和AOF

时间 2020-05-26

标签 redis 持久 rdb aof 栏目 Redis 繁體版

原文原文链接

1、Redis两种持久化方式

对Redis而言，其数据是保存在内存中的，一旦机器宕机，内存中的数据会丢失，所以须要将数据异步持久化到硬盘中保存。这样，即便机器宕机，数据能从硬盘中恢复。html

常见的数据持久化方式：linux

1.快照：相似拍照记录时光，快照是某时某刻将数据库的数据作拍照记录下其数据信息。如MYSQL的Dump，Redis的RDB模式redis

2.写日志方式：是将数据的操做所有写到日志当中，须要恢复的时候，按照日志记录的操做记录从新再执行一遍。例如MYSQL的Binlog，Redis的AAOF模式、数据库

2、RDB

说明：

redis默认开启，将redis在内存中保存的数据，以快照的方式持久化到硬盘中保存。vim

触发机制：

1.save命令：阻塞方式，须要等redis执行完save后，才能执行其余get、set等操做。同步方式安全

2.bgsave命令：非阻塞，其原理是调用linux 的 fork()函数，建立redis的子进程，子进程进行建立 rdb 文件的操做。异步方式，app

3.自动方式：在redis.conf文件中配置，以下 save <指定时间间隔> <执行指定次数更新操做> ，save 60 10000 表示 60秒年内有10000次操做会自动生成rdb文件。异步

# Save the DB on disk: #
#   save <seconds> <changes>
#
#   Will save the DB if both the given number of seconds and the given #   number of write operations against the DB occurred.
#
# In the example below the behaviour will be to save: #   after 900 sec (15 min) if at least 1 key changed #   after 300 sec (5 min) if at least 10 keys changed #   after 60 sec if at least 10000 keys changed #
#   Note: you can disable saving at all commenting all the "save" lines.
#
# It is also possible to remove all the previously configured save # points by adding a save directive with a single empty string argument # like in the following example: #
#   save "" save 900 1 save 300 10 save 60 10000

4.其余方式分布式

4.1 执行flushall命令，清空数据，几乎不用
4.2 执行shutdown命令，安全关闭redis不丢失数据，几乎用不到。
4.3 主从复制，在主从复制的时候，rdb文件做为媒介来关联主节点和从节点的数据一致。

最佳配置参考：

vim redis.conf

# 1. 将自动生成rdb文件注释掉 # save 900 1
# save 300 10
# save 60 10000

# The filename where to dump the DB # 2. rdb的文件名，改成dump+ 端口.rbd dbfilename dump-${port}.rdb # Note that you must specify a directory here, not a file name.
# 3. 文件持久化目录，日志目录，改到分布式存储中或者放到较大的硬盘目录中。 dir /yourbigdata/

# 4. 在bgsave发生错误时中止写入 stop-writes-on-bgsave-error yes # 5.采用压缩方式，否则生成的rdb文件可能巨大无比。压缩后主从复制拷贝文件小，速度也快。 rdbcompression yes # 6.采用校验和 rdbchecksum yes

RDB优缺点

优势：
1 适合大规模的数据恢复。
2 若是业务对数据完整性和一致性要求不高，RDB是很好的选择。函数

缺点：
1 不可控，容易丢失数据：数据的完整性和一致性不高，由于RDB可能在最后一次备份时宕机了。
2 耗时耗性能：备份时占用内存，由于Redis 在备份时会独立建立一个子进程，将数据写入到一个临时文件（此时内存中的数据是原来的两倍哦），最后再将临时文件替换以前的备份文件。
因此Redis 的持久化和数据的恢复要选择在夜深人静的时候执行是比较合理的。

3、AOF

说明：

redis默认不开启，采用日志的形式来记录每一个写操做，并追加到 .aof 文件中。Redis 重启的会根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工做

生成AOF的三种策略：

1. always : 每条命令都会刷新到缓冲区，把缓冲区fsync到硬盘，对硬盘IO压力大，通常sata盘只有几百TPS，若是redis的写入量很是大，那对硬盘的压力也横刀。

2. everysec: 每秒把缓冲区fsync 到硬盘，若是出现故障，会丢失1s（默认配置是1秒）的数据。通常使用这种。

3. no : 由操做系统来定何时fsync到硬盘中。缺点：不可控

AOF重写：

把过时的，没有用的，重复的，可优化的命令简化为很小的aof文件。其实是redis内存中的数据回溯成aof文件。

以下图所示：

做用：

1.减小硬盘占用量

2.加快恢复速度

AOF重写的实现方式

1.bgrewriteaof 命令：从redis的主进程fork一个子进程生成包含当前redis内存数据的最小命令集、

2.AOF重写配置：

# 1. aof文件增加率 auto-aof-rewrite-percentage 100

# 2. aof文件重写须要的尺寸 auto-aof-rewrite-min-size 64mb

自动触发时机：（须要同时知足）

当前的aof文件大小 > aof文件重写须要的尺寸
（aof当前文件大小 - 上次aof的文件大小）/ 上次aof文件大小 > aof文件增加率

最佳配置参考：

vim redis.conf

# 1. 打开aof功能 appendonly yes # 2. 重命名aof文件名,以端口号区分 appendfilename "appendonly-${port}.aof"

# 3. 使用everysec策略 appendfsync everysec

# 4. 文件持久化目录，日志目录，改到分布式存储中或者放到较大的硬盘目录中。 dir /yourbigdata/

# 5. 在aof重写的时候，不作aof的append（追加）操做，这里出于性能考虑
no-appendfsync-on-rewrite yes

AOF优缺点

优势：

1.数据的完整性和一致性更高

缺点：

1.由于AOF记录的内容多，文件会愈来愈大，数据恢复也会愈来愈慢。

2. AOF每秒fsync一次指令硬盘，若是硬盘IO慢，会阻塞父进程；风险是会丢失1秒多的数据；在Rewrite过程当中，主进程把指令存到mem-buffer中，最后写盘时会阻塞主进程。

4、关于Redis持久化方式RDB和AOF的缺点

缘由是redis持久化方式的痛点，缺点比较明显。

一、RDB须要定时持久化，风险是可能会丢两次持久之间的数据，量可能很大。

二、AOF每秒fsync一次指令硬盘，若是硬盘IO慢，会阻塞父进程；风险是会丢失1秒多的数据；在Rewrite过程当中，主进程把指令存到mem-buffer中，最后写盘时会阻塞主进程。

三、这两个缺点是个很大的痛点。为了解决这些痛点，GitHub的两位工程师 Bryana Knight 和 Miguel Fernández 日前写了一篇文章，讲述了将持久数据从Redis迁出的经验：

http://www.open-open.com/lib/view/open1487736984424.html

5、如何选择RDB和AOF

建议全都要。

一、对于咱们应该选择RDB仍是AOF，官方的建议是两个同时使用。这样能够提供更可靠的持久化方案。

在redis 4.0 以后，官方提供了混合持久化模式，具体以下

持久化文件结构

上半段RDB格式，后半段是AOF模式。

如何配置

vim redis.conf

aof-use-rdb-preamble yes

以后重启redis，运行bgrewriteaof命令，重写appendonly.aof，以后在Redis数据同步的时候，能够先加载rdb的内容，而后再执行aof指令部分使Redis数据同步

数据恢复过程

加载AOF文件的入口为loadAppendOnlyFile，代码以下

int loadAppendOnlyFile(char *filename) { ... /* Check if this AOF file has an RDB preamble. In that case we need to * load the RDB file and later continue loading the AOF tail. */
    char sig[5]; /* "REDIS" */
    if (fread(sig,1,5,fp) != 5 || memcmp(sig,"REDIS",5) != 0) { /* No RDB preamble, seek back at 0 offset. */
        if (fseek(fp,0,SEEK_SET) == -1) goto readerr; } else { /* RDB preamble. Pass loading the RDB functions. */ rio rdb; serverLog(LL_NOTICE,"Reading RDB preamble from AOF file..."); if (fseek(fp,0,SEEK_SET) == -1) goto readerr; rioInitWithFile(&rdb,fp); if (rdbLoadRio(&rdb,NULL) != C_OK) { serverLog(LL_WARNING,"Error reading the RDB preamble of the AOF file, AOF loading aborted"); goto readerr; } else { serverLog(LL_NOTICE,"Reading the remaining AOF tail..."); } } ... }

1.打开AOF文件以后首先读取5个字符若是是"REDIS" ，那么就说明这是一个混合持久化的AOF文件，执行rdbLoadRio() 函数，解析RDB格式，解析文件内容直至遇到RDB_OPCODE_EOF结束。

2. 执行 loadAppendOnlyFile() 函数，解析 AOF格式，直到结束整个加载过程完成。

说明：正确的RDB格式必定是以"REDIS"开头而纯AOF格式则必定以"*"开头此时就会进入rdbLoadRio函数来加载数据。

这样就实现了混合持久化，加载aof文件时候，实现了数据文件不太大，并且能保证数据不丢失，加载效率比纯aof文件高。

本文根据视频和博客概括。

参考：redis，

https://yq.aliyun.com/articles/193034

感谢支持，感谢观看。