摘要: 2018飞天技术汇24期-云数据库Redis产品发布会,由阿里云数据库技术组技术专家王欢、怀听、梁盼分别带来以“Redis全球多活产品”、“Redis混合存储产品”、“Redis多线程性能加强版”为题的演讲,本文对Redis进行了简单的介绍,进而针对不一样的应用场景研制出不一样的产品,并对不一样产品分别进行了详细地介绍。
2018飞天技术汇24期-云数据库Redis产品发布会,由阿里云数据库技术组技术专家王欢、怀听、梁盼分别带来以“Redis全球多活产品”、“Redis混合存储产品”、“Redis多线程性能加强版”为题的演讲。本文对Redis进行了简单的介绍,进而针对不一样的应用场景研制出不一样的产品,并对不一样产品分别进行了详细地介绍。
Redis简介
Redis 是一个高性能的key-value数据库,Redis的优点有不少,例如,它的性能极高 ,Redis能读的速度是110000次/s,写的速度是81000次/s ;它具备丰富的数据类型,可支持二进制案例的 Strings、Lists、Hashes、Sets 及 Ordered Sets 数据类型操做;它的全部操做都是原子性的,意思就是要么成功执行要么失败彻底不执行;它还具备丰富的特性, 即支持 publish/subscribe、通知、key过时等等特性。
Redis 与其余key - value 缓存产品有三个共同特色:一是Redis支持数据的持久化,能够将内存中的数据保存在磁盘中,重启的时候能够再次加载进行使用;二是Redis不只仅支持简单的key-value类型的数据,同时还提供list、set、zset、hash等数据结构的存储;三是Redis支持数据的备份,即master-slave模式的数据备份。
Redis与其余key-value存储的不一样点在于Redis有着更为复杂的数据结构而且提供对它们的原子性操做,这是一个不一样于其余数据库的进化路径。Redis的数据类型都是基于基本数据结构的同时对程序员是透明的,无需进行额外的抽象。另外的一个不一样点在于Redis在内存中运行时能够持久化到磁盘中,因此在对不一样数据集进行高速读写时须要权衡内存,由于数据量不能大于硬件内存。所以,与磁盘上相同的复杂数据结构相比,在内存中操做起来更为简单,这样Redis能够作不少内部复杂性很强的事情。同时,在磁盘格式方面它们是紧凑以追加的方式产生的,由于他们并不须要进行随机访问。
Redis全球多活产品
Redis全球多活产品是指多个Redis实例分布在全球不一样的区域,它是阿里云自研、基于云数据库Redis版(ApsaraDB for Redis)、100%兼容 Redis 协议的多活数据库系统。经过数据同步通道,把多个Redis实例组网成1个逻辑上的 Redis 多活实例,多活实例内的全部实例都可读写并保持实时数据同步。数据同步通道经过内网打通,具备高可靠、高安全、低延迟的特性。子实例间经过CRDT(Conflict-free Replicated Data Type)机制检测并解决数据冲突,保障数据最终一致性。Redis全球多活产品轻松支持异地多个站点同时对外提供服务的业务场景,助力企业快速复制阿里巴巴异地多活架构。
高可用架构演练之路
程序在运行过程当中总会遇到各类各样的问题,例如程序bug、机器故障、机房断电起火故障等,业务上要求发生这些故障时要保证数据一致性和业务可用性,因此就有了架构演练之路,即单可用区-同城容灾-两地三中心-异地多活。
因为单可用区架构没法应对机房出现故障,就有了同城容灾的架构。同城容灾架构因为没法应对地域级别的问题,接着就有了两地三中心架构。因为许多金融业务要求数据存储在不一样的地域中,同时对故障恢复时间有要求,所以两地三中心架构就在同城容灾基础上加了一个standby中心,但依旧存在几个缺陷,即冷备中心不工做,关键时刻不敢切的缺陷;冷备中心不工做,成本浪费的缺陷;本质上数据仍然单点写,数据库瓶颈没法解的缺陷;资源、容灾、扩展没法解决的缺陷。
后来有了异地多活架构,它是指全部的中心都提供业务服务,底层的数据可以相互同步,所以存在着许多优势,例如,全部中心工做,切换有保障;全部中心工做,成本低;弹性伸缩,增长/减小中心个数;故障独立性致使中心不可用时,只影响部分用户。
产品架构程序员
异地多活产品架构图如上图所示,它是由云数据库Redis版实例、同步通道和通道管理器三部分组成。因为异地多活是由多个Redis实例组成,所以能够实现每一个子实例之间实时数据同步、每一个子实例数据最终一致、每一个子实例都可读写等功能。
在异地多活构架中,对Redis进行了aof binlog增长oplog和CRDT策略merge key的改造,其中aof binlog增长oplog中包含gtid和逻辑时钟信息,解决了循环同步、Exactly-once Apply的问题;CRDT策略merge key中解决了一致性的问题。
异地多活产品具备高可用、高性能、数据最终一致以及功能丰富的特性,具体介绍以下:
● 高可用
高可用是指同步通道支持断点续传,它最高可容忍天级别的隔断,且隔断以后数据还能够在断点处继续同步;同时,同步通道还能够自适应处理子实例异常,例如主备切换、备库重搭等。
● 高性能
高性能是指它具备异步复制同步不影响Redis自身读写性能,由于它自己定位就具备高性能、高吞吐、低延迟的性能,高吞吐是指它具备标准版Redis使得单向同步链路高达10万TPS以及随Redis节点数线性扩展的集群版Redis。低延迟是指洲际内地域仅需百毫秒,更厉害的是跨洲际地域仅需 1秒级。
● 最终一致性
为了解决过去的架构因为异步同步的逻辑产生的一致性问题,最终引进了CRDT(Conflict-Free Replicated Data Types)策略,它可支持最终一致性的数据类型有 String/Counter、Hash、Set、Zset、Geo、hyperloglog等。
● 功能丰富
异地多活产品增长了支持 Redis 实例类型、同步中的子实例支持变配规格、新增与删除子实例等新功能,其中支持的 Redis 实例类型包括标准版、集群版以及读写分离版。
业务设计数据库
异地多活业务具备不一样的业务有不一样的业务设计要求,它必须容许多个地域具备同时修改同一份数据的功能,例如全局session、全局PV、用户收藏夹、购物车、地理位置信息、收藏夹、历史搜索记录、弹幕、评论等。同时,它还须要作数据切分,要求一份数据只容许有1个写入点。
多活业务设计的要点有自包含性、松耦合性和路由规则一致性,即多活业务设计的全部计算与数据必须在1个中心内完成;跨单元之间只能进行服务调用,不能直接访问数据库或其余存储;路由必须是入口路由或者微服务调用路由。
Redis混合存储产品
Redis混合存储实例是阿里云自主研发的彻底兼容Redis协议和特性的混合存储产品。经过将部分冷数据存储到磁盘,在保证绝大部分访问性能不降低的基础上,大大下降了用户成本,并突破了内存对Redis单实例数据量的限制。
技术架构缓存
它的数据类型是将热数据存储在内存里,将冷数据存储在磁盘里面,顾名思义,热数据就是指频繁访问到的数据。由于全部的Redis都会访问到Keys,相对来讲Keys的访问天生就比Values大许多,所以Redis混合存储产品是将全部的Keys、常访问的Values放到内存里存储,而不常常访问的Values放到磁盘里存储。在业务场景里面,Keys只占十几个字节,但Values却占几百甚至几千个字节,因此将全部的Keys放到内存里对总体性能可以提升不少。安全
Redis混合存储架构如上图所示,从业务模型来看,咱们把Redis混合存储架构分为三层,第一层是计算层,它包含全部Redis的网络链接、协议解析、定时任务、命令处理、过时、淘汰、同步等业务逻辑;第二层是数据层,它包含热数据表示、冷热数据交换、冷数据编解码;第三层是存储层,它包含存储引擎、文件系统以及硬件管理。
其中,数据层进行冷热交换是为了保证兼容性,由于全部Redis的业务逻辑是采用主线程来处理的,全部实际的IO是由后台来运行的,进而也不会阻挡主线程的运行。在热数据转换成冷数据的过程当中,数据量小于内存时,Redis混合存储会把全部的Keys和Values放到内存里面,这样能够达到性能最高。当数据量愈来愈大时,内存里会出现存不下的现象,这时会按照最近的访问频率筛选出一些不多被访问到的Values,而后由主线程生成IO任务,接着后台的IO线程拿到这些任务存储到磁盘中,最后主线会将这些Values释放掉。在冷数据转换成热数据的过程当中,收到用户请求后,首先判断任务请求会访问到哪些Values,而后看这些Values是否都在内存里面,若是部分Values不在,会对这些Values生成IO任务,而后主线程将客户端挂起,接着继续处理其它客户端的请求,当此线程拿到这些任务后,会把数据从磁盘里面加载到内存里面,同时通知给主线程,主线程收到这些通知以后会将挂起的客户端唤醒继续处理其余用户请求。
对于存储层而言,磁盘上的存储是跟阿里巴巴的服务器研发团队共建的一个用户态的存储引擎,称为FusionEngine。它是由业务定制一个RocksDB,而后经过底层的一个用户固态的文件系统来缩短用户的IO路径,进而避免了内核的开销。在业务场景里面,FusionEngine的性能比过去的文件系统性能提高了约80%左右,所以总体的Redis混合存储性能也获得了有效的提高。
产品特性
Redis混合存储产品的底层实线是支持冷热数据任意配比的,便可以任意的匹配内存占用多少和磁盘占用多少,进而在性能和成本上达到一个平衡。在应用中,全部的数据量不能超过内存加磁盘的容量。此产品适用于Values比较大的场景,由于Values对性能的影响不是很大,因此也比较适合数据访问冷热不均的场景。目前混合存储开通的区域有华北2(北京)的可用区D、华东1(杭州)的可用区E、华南1(深圳)的可用区C。
应用场景
Redis混合存储产品应用的场景包含电商类应用、直播类应用、互联网类应用,对于电商类应用而言,它的活跃商品数据存放到内存中,冷门商品数据存放到磁盘中;对于直播类应用而言,它的活跃直播间和热门直播间的数据存放到内存中,下线直播间和冷门直播间的数据存放到磁盘中;对于互联网类应用而言,它的首页和热门贴数据存放到内存中,冷门帖子存放到磁盘中。
Redis多线程性能加强版
Redis多线程性能加强版突破了Redis单线程的性能瓶颈,且100%兼容原生Redis,业务无需修改任何代码。经过将命令解析,读写,响应等事件分发给多个IO线程并发处理,实现处理性能质的飞跃。
技术架构
原生的Redis是进行串行处理的,当它接收到一个请求时,会尝试链接读取到一部分数据,并对这部分数据进行解析,若是解析到一个完整的数据,就会对这个数据进行处理。当这个数据处理完以后,会生成对数据的一个响应,针对这个响应在发送给客户端。原生的Redis存在一个缺陷,就是不能作到并发。相对而言,Redis多线程作的一个Master-Slave架构就可以作到并发,它是将Master数据处理完以后,将数据同步到Slave上。服务器
如上图所示,Redis多线程性能加强版是由主线程、多个IO线程和WORKER线程组成,主线程主要负责接受链接,建立client,将链接转发给IO线程。IO线程负责处理链接的读写事件,解析命令,将解析的完整命令转发给WORKER线程处理,发送response包,负责删除链接等;WORKER线程负责命令的处理,生成客户端回包,定时器事件的执行等。
在线程间数据在进行交换的过程当中,一个IO线程在获取到链接以后,就开始尝试在这个链接上读取请求,而后对请求作一个解析,若解析到是一个完整的请求,就会将请求放到队列里面。接着,IO线程通知WORKER线程有新的命令须要处理,这个通知是经过管道来进行的。最后,WORKER线程接受到命令后就会对其进行处理,处理完以后会造成对命令的响应,并将响应放到队列里面,一样,WORKER线程也会通知IO线程。
产品特性网络
IO线程越多,Redis多线程的性能越好,可是IO线程与Redis多线程的性能并非线性的,当IO线程达到必定的数量时,WORKER就会达到一个瓶颈。所以,IO线程最多支持多达6个,默认状况下只有一个IO线程。另外须要注意的是,线程数个数跟规格是绑定的,一旦选定实例建立完毕后没法动态修改,如需修改,就须要经过升级规格的方式完成。
Redis多线程并非在全部的场景中都适用,Redis多线程只适用于主从版没法知足性能需求时、集群版shard节点成为性能瓶颈时、读写分离版本有热写瓶时以及同步延迟等问题时。
应用场景
Redis多线程性能加强版主要应用在电商类应用、直播类应用中,对于电商类应用而言,适用于秒杀场景和库存计数;对于直播类应用而言,主要适用于热点直播间和明星大V的直播。session
原文连接数据结构
本文为云栖社区原创内容,未经容许不得转载。多线程