Redis全部的数据都存在内存中,当前内存虽然愈来愈便宜,但跟廉价的硬盘相比成本仍是比较昂贵,所以如何高效利用Redis内存变得很是重要。redis
高效利用Redis内存首先须要理解Redis内存消耗在哪里,如何管理内存,最后才能考虑如何优化内存。算法
1、内存消耗数据库
有些内存消耗是必不可少的,而有些能够经过参数调整和合理使用来规避内存浪费。json
内存消耗能够分为进程自身消耗和子进程消耗。数组
1.内存使用统计缓存
root@bigjun:~# redis-cli 127.0.0.1:6379> info memory # Memory used_memory:848336 Redis分配器分配的内存总量,也就是内部存储全部数据内存占用量 used_memory_human:828.45K 以可读的形式返回user_memory used_memory_rss:4304896 从操做系统的角度显示Redis进程占用的物理内存空间 used_memory_rss_human:4.11M 以可读的形式返回used_memory_rss used_memory_peak:848336 内存使用的最大值,表示used_memory的峰值 used_memory_peak_human:828.45K 以可读的形式返回used_memory_peak used_memory_peak_perc:100.01% used_memory_overhead:836078 used_memory_startup:786448 used_memory_dataset:12258 used_memory_dataset_perc:19.81% total_system_memory:4112789504 系统总内存大小 total_system_memory_human:3.83G 以可读的形式返回total_system_memory used_memory_lua:37888 Lua引擎所消耗的内存大小 used_memory_lua_human:37.00K 以可读的形式返回used_memory_lua maxmemory:0 maxmemory_human:0B maxmemory_policy:noeviction mem_fragmentation_ratio:5.07 used_memory_rss/used_memory比值,表示内存碎片率 mem_allocator:jemalloc-4.0.3 Redis使用的内存分配器,默认为jemalloc active_defrag_running:0 lazyfree_pending_objects:0 须要重点关注的指标有:used_memory_rss、used_memory以及他们的比值mem_fragmentation_ratio 当mem_fragmentation_ratio > 1时,说明used_memory_rss - used_memory多处的部份内存并无用于数据存储,而是被内存碎片所消耗,若是二者相差很大,说明碎片率严重。 当mem_fragmentation_ratio < 1 时,这种状况通常出如今操做系统把Redis内存交换到硬盘致使,出现这种状况要格外关注,因为硬盘速度远远慢于内存,Redis性能会变得不好,甚至僵死。
2.内存消耗划分安全
Redis进程内消耗主要包括:自身内存+对象内存+缓冲内存+内存碎片,其中Redis空进程自身内存消耗很是少,一般used_memory_rss在3MB左右,used_memory在800KB左右,一个空的Redis进程消耗内存能够忽略不计。服务器
(1)对象内存数据结构
对象内存是Redis内存占用最大的一块,存储着用户全部的数据。Redis全部的数据都采用key-value数据类型,每次建立键值对时,至少建立两个类型对象:key对象和value对象。架构
对象内存消耗能够简单理解为sizeof(keys)+sizeof(values)。
键对象都是字符串,在使用Redis时很容易忽略键对内存消耗的影响,应当避免使用过长的键。
value对象更复杂些,主要包含5种基本数据类型:字符串、列表、哈希、集合、有序集合。
其余数据类型都是创建在这5种数据结构之上实现的,如:Bitmaps和HyperLogLog使用字符串实现,GEO使用有序集合实现等。每种value对象类型根据使用规模不一样,占用内存不一样。在使用时必定要合理预估并监控value对象占用状况,避免内存溢出。
(2)缓冲内存
缓冲内存主要包括:客户端缓冲、复制积压缓冲区、AOF缓冲区。
(3)内存碎片
Redis默认的内存分配器采用jemalloc,可选的分配器还有:glibc、tcmalloc。
内存分配器为了更好地管理和重复利用内存,分配内存策略通常采用固定范围的内存块进行分配。
例如jemalloc在64位系统中将内存空间划分为:小、大、巨大三个范围。每一个范围内又划分为多个小的内存块单位,以下所示:
好比当保存5KB对象时jemalloc可能会采用8KB的块存储,而剩下的3KB空间变为了内存碎片不能再分配给其余对象存储。内存碎片问题虽然是全部内存服务的通病,可是jemalloc针对碎片化问题专门作了优化,通常不会存在过分碎片化的问题,正常的碎片率(mem_fragmentation_ratio)在1.03左右。
可是当存储的数据长短差别较大时,如下场景容易出现高内存碎片问题:
出现高内存碎片问题时常见的解决方式以下:
3.子进程内存消耗
子进程内存消耗主要指执行AOF/RDB重写时Redis建立的子进程内存消耗。
Redis执行fork操做产生的子进程内存占用量对外表现为与父进程相同,理论上须要一倍的物理内存来完成重写操做。但Linux具备写时复制技术(copy-on-write),父子进程会共享相同的物理内存页,当父进程处理写请求时会对须要修改的页复制出一份副本完成写操做,而子进程依然读取fork时整个父进程的内存快照。
子进程内存消耗总结以下:
2、内存管理
Redis主要经过控制内存上限和回收策略实现内存管理。
1.设置内存上限
Redis使用maxmemory参数限制最大可用内存。限制内存的目的主要有:
须要注意,maxmemory限制的是Redis实际使用的内存量,也就是used_memory统计项对应的内存。因为内存碎片率的存在,实际消耗的内存可能会比maxmemory设置的更大,实际使用时要当心这部份内存溢出。经过设置内存上限能够很是方便地实现一台服务器部署多个Redis进程的内存控制。
好比一台24GB内存的服务器,为系统预留4GB内存,预留4GB空闲内存给其余进程或Redis fork进程,留给Redis16GB内存,这样能够部署4个maxmemory=4GB的Redis进程。得益于Redis单线程架构和内存限制机制,即便没有采用虚拟化,不一样的Redis进程之间也能够很好地实现CPU和内存的隔离性。
2.动态调整内存上限
Redis的内存上限能够经过config set maxmemory进行动态修改,即修改最大可用内存。
例如以前的示例,当发现Redis-2没有作好内存预估,实际只用了不到2GB内存,而Redis-1实例须要扩容到6GB内存才够用,这时能够分别执行以下命令进行调整:
Redis-1>config set maxmemory 6GB Redis-2>config set maxmemory 2GB
经过动态修改maxmemory,能够实如今当前服务器下动态伸缩Redis内存的目的。
若是此时Redis-3和Redis-4实例也须要分别扩容到6GB,这时超出系统物理内存限制就不能简单的经过调整maxmemory来达到扩容的目的,须要采用在线迁移数据或者经过复制切换服务器来达到扩容的目的。
3.内存回收策略
Redis的内存回收机制主要体如今如下两个方面:
(1)删除过时键对象
Redis全部的键均可以设置过时属性,内部保存在过时字典中。因为进程内保存大量的键,维护每一个键精准的过时删除机制会致使消耗大量的CPU,对于单线程的Redis来讲成本太高,所以Redis采用惰性删除和定时任务删除机制实现过时键的内存回收。
流程说明:
(2)内存溢出控制策略
当Redis所用内存达到maxmemory上限时会触发相应的溢出控制策略。具体策略受maxmemory-policy参数控制,Redis支持6种策略,以下所示:
3、内存优化
1.RedisObject对象
Redis存储的全部值对象在内部定义为redisObject结构体,内部结构如图
Redis存储的数据都使用redisObject来封装,包括string、hash、list、set、zset在内的全部数据类型。
2.缩减键值对象
下降Redis内存使用最直接的方式就是缩减键(key)和值(value)的长度。
值对象除了存储二进制数据以外,一般还会使用通用格式存储数据好比:json、xml等做为字符串存储在Redis中。这种方式优势是方便调试和跨语言,可是一样的数据相比字节数组所需的空间更大,在内存紧张的状况下,可使用通用压缩算法压缩json、xml后再存入Redis,从而下降内存占用,例如使用GZIP压缩后的json可下降约60%的空间。
3.共享对象池
共享对象池是指Redis内部维护[0-9999]的整数对象池。建立大量的整数类型redisObject存在内存开销,每一个redisObject内部结构至少占16字节,甚至超过了整数自身空间消耗。因此Redis内存维护一个[0-9999]的整数对象池,用于节约内存。除了整数值对象,其余类型如list、hash、set、zset内部元素也可使用整数对象池。所以开发中在知足需求的前提下,尽可能使用整数对象以节省内存。
Object refcount命令主要用于调试,可以返回指定key所对应的value被引用的次数,在0-9999之间的整数,都是共享内存的,因此返回值是同一个数:2147483647。
因为100是0-9999之间的数,因此都会共享内存。 127.0.0.1:6379> keys * (empty list or set) 127.0.0.1:6379> set test:1 100 OK 127.0.0.1:6379> object refcount test:1 (integer) 2147483647 127.0.0.1:6379> set test:2 100 OK 127.0.0.1:6379> object refcount test:2 (integer) 2147483647
开启共享对象池以后,
redis> set foo 100 OK redis> object refcount foo (integer) 2 redis> set bar 100 OK redis> object refcount bar (integer) 3
4.字符串优化
字符串对象是Redis内部最经常使用的数据类型。全部的键都是字符串类型,值对象数据除了整数以外都使用字符串存储。
好比执行命令:lpush cache:type "redis" "memcache" "tair" "levelDB",Redis首先建立"cache:type"键字符串,而后建立链表对象,链表对象内再包含四个字符串对象,排除Redis内部用到的字符串对象以外至少建立5个字符串对象。
(1)字符串结构
Redis没有采用原生C语言的字符串类型而是本身实现了字符串结构,内部简单动态字符串(simple dynamic string,SDS)。
Redis自身实现的字符串结构有以下特色:
(2)预分配机制
字符串之因此采用预分配的方式是防止修改操做须要不断重分配内存和字节数据拷贝。但一样也会形成内存的浪费。字符串预分配每次并不都是翻倍扩容,空间预分配规则以下:
(3)字符串重构
字符串重构:指不必定把每份数据做为字符串总体存储,像json这样的数据可使用hash结构,使用二级结构存储也能帮咱们节省内存。同时可使用hmget、hmset命令支持字段的部分读取修改,而不用每次总体存取。例以下面的json数据:
{ "vid": "413368768", "title": " 搜狐屌丝男士 ", "videoAlbumPic":"http://photocdn.sohu.com/60160518/vrsa_ver8400079_ae433_pic26.jpg", "pid": "6494271", "type": "1024", "playlist": "6494271", "playTime": "468" }
分别使用字符串和hash结构,能够看到使用内存的差别:
根据测试结构,第一次默认配置下使用hash类型,内存消耗不但没有下降反而比字符串存储多出2倍,而调整hash-max-ziplist-value=66以后内存下降为535.60M。由于json的videoAlbumPic属性长度是65,而hash-max-ziplist-value默认值是64,Redis采用hashtable编码方式,反而消耗了大量内存。调整配置后hash类型内部编码方式变为ziplist,相比字符串更省内存且支持属性的部分操做。
5.编码优化
(1)编码类型
Redis对外提供了string、list、hash、set、zet等类型,可是Redis内部针对不一样类型存在编码的概念,所谓编码就是具体使用哪一种底层数据结构来实现。编码不一样将直接影响数据的内存占用和读写效率。使用object encoding {key}命令获取编码类型。
127.0.0.1:6379> set str:1 hello OK 127.0.0.1:6379> object encoding str:1 "embstr" 127.0.0.1:6379> lpush list:1 1 2 3 (integer) 3 127.0.0.1:6379> object encoding list:1 "quicklist"
Redis针对每种数据类型(type)能够采用至少两种编码方式来实现。
(2)控制编码类型
编码类型转换在Redis写入数据时自动完成,这个转换过程是不可逆的,转换规则只能从小内存编码向大内存编码转换。
Redis旧版本: redis> lpush list:1 a b c d (integer) 4 // 存储 4 个元素 redis> object encoding list:1 "ziplist" // 采用 ziplist 压缩列表编码 redis> config set list-max-ziplist-entries 4 OK // 设置列表类型 ziplist 编码最大容许 4 个元素 redis> lpush list:1 e (integer) 5 // 写入第 5 个元素 e redis> object encoding list:1 "linkedlist" // 编码类型转换为链表 redis> rpop list:1 "a" // 弹出元素 a redis> llen list:1 (integer) 4 // 列表此时有 4 个元素 redis> object encoding list:1 "linkedlist" // 编码类型依然为链表,未作编码回退
Redis之因此不支持编码回退,主要是数据增删频繁时,数据向压缩编码转换很是消耗CPU,得不偿失。以上示例用到了list-max-ziplist-entries参数,这个参数用来决定列表长度在多少范围内使用ziplist编码。固然还有其余参数控制各类数据类型的编码。
6.控制键的数量
当使用Redis存储大量数据时,一般会存在大量键,过多的键一样会消耗大量内存。
Redis本质是一个数据结构服务器,它为咱们提供多种数据结构,如hash、list、set、zset等。使用Redis时不要进入一个误区,大量使用get/set这样的API,把Redis当成Memcached使用。
对于存储相同的数据内容利用Redis的数据结构下降外层键的数量,也能够节省大量内存。
能够经过在客户端预估键规模,把大量键分组映射到多个hash结构中下降键的数量,如图:
hash结构下降键数量分析:
经过这个测试数据,能够说明:
使用hash重构后节省内存量效果很是明显,特别对于存储小对象的场景,内存只有不到原来的1/5。下面分析这种内存优化技巧的关键点:
关于hash键和field键的设计:
使用hash结构控制键的规模虽然能够大幅下降内存,但一样会带来问题,须要提早作好规避处理。以下所示:
不过瑕不掩瑜,对于大量小对象的存储场景,很是适合使用ziplist编码的hash类型控制键的规模来下降内存。