单线程的Redis为何这么快

1、前言

近乎全部与Java相关的面试都会问到缓存的问题,基础一点的会问到什么是“二八定律”、什么是“热数据和冷数据”,复杂一点的会问到缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级等问题,这些看似不常见的概念,都与咱们的缓存服务器相关,通常经常使用的缓存服务器有Redis、Memcached等,而笔者目前最经常使用的也只有Redis这一种。html

若是你在之前面试的时候尚未遇到过面试官问你《为何说Redis是单线程的以及Redis为何这么快!》,那么你看到这篇文章的时候,你应该以为是一件很幸运的事情!若是你恰好是一位高逼格的面试官,你也能够拿这道题去面试对面“望穿秋水”般的小伙伴,测试一下他的掌握程度。面试

好啦!步入正题!咱们先探讨一下Redis是什么,Redis为何这么快、而后在探讨一下为何Redis是单线程的?redis

2、Redis简介

Redis是一个开源的内存中的数据结构存储系统,它能够用做:数据库、缓存和消息中间件数据库

它支持多种类型的数据结构,如字符串(String),散列(Hash),列表(List),集合(Set),有序集合(Sorted Set或者是ZSet)与范围查询,Bitmaps,Hyperloglogs 和地理空间(Geospatial)索引半径查询。其中常见的数据结构类型有:String、List、Set、Hash、ZSet这5种。缓存

Redis 内置了复制(Replication),LUA脚本(Lua scripting), LRU驱动事件(LRU eviction),事务(Transactions) 和不一样级别的磁盘持久化(Persistence),并经过 Redis哨兵(Sentinel)和自动分区(Cluster)提供高可用性(High Availability)。服务器

Redis也提供了持久化的选项,这些选项可让用户将本身的数据保存到磁盘上面进行存储。根据实际状况,能够每隔必定时间将数据集导出到磁盘(快照),或者追加到命令日志中(AOF只追加文件),他会在执行写命令时,将被执行的写命令复制到硬盘里面。您也能够关闭持久化功能,将Redis做为一个高效的网络的缓存数据功能使用。网络

Redis不使用表,他的数据库不会预约义或者强制去要求用户对Redis存储的不一样数据进行关联。数据结构

数据库的工做模式按存储方式可分为:硬盘数据库和内存数据库。Redis 将数据储存在内存里面,读写数据的时候都不会受到硬盘 I/O 速度的限制,因此速度极快。多线程

(1)硬盘数据库的工做模式: 
 
(2)内存数据库的工做模式: 
并发

看完上述的描述,对于一些常见的Redis相关的面试题,是否有所认识了,例如:什么是Redis、Redis常见的数据结构类型有哪些、Redis是如何进行持久化的等。

3、Redis到底有多快

Redis采用的是基于内存的采用的是单进程单线程模型的 KV 数据库由C语言编写,官方提供的数据是能够达到100000+的QPS(每秒内查询次数)。这个数据不比采用单进程多线程的一样基于内存的 KV 数据库 Memcached 差!有兴趣的能够参考官方的基准程序测试《How fast is Redis?》(https://redis.io/topics/benchmarks

 
横轴是链接数,纵轴是QPS。此时,这张图反映了一个数量级,但愿你们在面试的时候能够正确的描述出来,不要问你的时候,你回答的数量级相差甚远!

4、Redis为何这么快

一、彻底基于内存,绝大部分请求是纯粹的内存操做,很是快速。数据存在内存中,相似于HashMap,HashMap的优点就是查找和操做的时间复杂度都是O(1);

二、数据结构简单,对数据操做也简单,Redis中的数据结构是专门进行设计的;

三、采用单线程,避免了没必要要的上下文切换和竞争条件,也不存在多进程或者多线程致使的切换而消耗 CPU,不用去考虑各类锁的问题,不存在加锁释放锁操做,没有由于可能出现死锁而致使的性能消耗;

四、使用多路I/O复用模型,非阻塞IO;

五、使用底层模型不一样,它们之间底层实现方式以及与客户端之间通讯的应用协议不同,Redis直接本身构建了VM 机制 ,由于通常的系统调用系统函数的话,会浪费必定的时间去移动和请求;

以上几点都比较好理解,下边咱们针对多路 I/O 复用模型进行简单的探讨:

(1)多路 I/O 复用模型

多路I/O复用模型是利用 select、poll、epoll 能够同时监察多个流的 I/O 事件的能力,在空闲的时候,会把当前线程阻塞掉,当有一个或多个流有 I/O 事件时,就从阻塞态中唤醒,因而程序就会轮询一遍全部的流(epoll 是只轮询那些真正发出了事件的流),而且只依次顺序的处理就绪的流,这种作法就避免了大量的无用操做。

这里“多路”指的是多个网络链接,“复用”指的是复用同一个线程。采用多路 I/O 复用技术可让单个线程高效的处理多个链接请求(尽可能减小网络 IO 的时间消耗),且 Redis 在内存中操做数据的速度很是快,也就是说内存内的操做不会成为影响Redis性能的瓶颈,主要由以上几点造就了 Redis 具备很高的吞吐量。

5、那么为何Redis是单线程的

咱们首先要明白,上边的种种分析,都是为了营造一个Redis很快的氛围!官方FAQ表示,由于Redis是基于内存的操做,CPU不是Redis的瓶颈,Redis的瓶颈最有多是机器内存的大小或者网络带宽。既然单线程容易实现,并且CPU不会成为瓶颈,那就瓜熟蒂落地采用单线程的方案了(毕竟采用多线程会有不少麻烦!)。


能够参考:https://redis.io/topics/faq

看到这里,你可能会气哭!本觉得会有什么重大的技术要点才使得Redis使用单线程就能够这么快,没想到就是一句官方看似糊弄咱们的回答!可是,咱们已经能够很清楚的解释了为何Redis这么快,而且正是因为在单线程模式的状况下已经很快了,就没有必要在使用多线程了!

可是,咱们使用单线程的方式是没法发挥多核CPU 性能,不过咱们能够经过在单机开多个Redis 实例来完善!

警告1:这里咱们一直在强调的单线程,只是在处理咱们的网络请求的时候只有一个线程来处理,一个正式的Redis Server运行的时候确定是不止一个线程的,这里须要你们明确的注意一下!例如Redis进行持久化的时候会以子进程或者子线程的方式执行(具体是子线程仍是子进程待读者深刻研究);例如我在测试服务器上查看Redis进程,而后找到该进程下的线程:

ps命令的“-T”参数表示显示线程(Show threads, possibly with SPID column.)“SID”栏表示线程ID,而“CMD”栏则显示了线程名称。

警告2:在上图中FAQ中的最后一段,表述了从Redis 4.0版本开始会支持多线程的方式,可是,只是在某一些操做上进行多线程的操做!因此该篇文章在之后的版本中是否仍是单线程的方式须要读者考证!

6、注意点

一、咱们知道Redis是用”单线程-多路复用IO模型”来实现高性能的内存数据服务的,这种机制避免了使用锁,可是同时这种机制在进行sunion之类的比较耗时的命令时会使redis的并发降低。由于是单一线程,因此同一时刻只有一个操做在进行,因此,耗时的命令会致使并发的降低,不仅是读并发,写并发也会降低。而单一线程也只能用到一个CPU核心,因此能够在同一个多核的服务器中,能够启动多个实例,组成master-master或者master-slave的形式,耗时的读命令能够彻底在slave进行。

须要改的redis.conf项:

pidfile /var/run/redis/redis_6377.pid #pidfile要加上端口号 port 6377 #这个是必须改的 logfile /var/log/redis/redis_6377.log #logfile的名称也加上端口号 dbfilename dump_6377.rdb #rdbfile也加上端口号

二、“咱们不能任由操做系统负载均衡,由于咱们本身更了解本身的程序,因此,咱们能够手动地为其分配CPU核,而不会过多地占用CPU,或是让咱们关键进程和一堆别的进程挤在一块儿。”。 
CPU 是一个重要的影响因素,因为是单线程模型,Redis 更喜欢大缓存快速 CPU, 而不是多核

在多核 CPU 服务器上面,Redis 的性能还依赖NUMA 配置和处理器绑定位置。最明显的影响是 redis-benchmark 会随机使用CPU内核。为了得到精准的结果,须要使用固定处理器工具(在 Linux 上可使用 taskset)。最有效的办法是将客户端和服务端分离到两个不一样的 CPU 来高校使用三级缓存。

7、扩展

如下也是你应该知道的几种模型,祝你的面试一臂之力!

一、单进程多线程模型:MySQL、Memcached、Oracle(Windows版本);

二、多进程模型:Oracle(Linux版本);

三、Nginx有两类进程,一类称为Master进程(至关于管理进程),另外一类称为Worker进程(实际工做进程)。启动方式有两种:

(1)单进程启动:此时系统中仅有一个进程,该进程既充当Master进程的角色,也充当Worker进程的角色。

(2)多进程启动:此时系统有且仅有一个Master进程,至少有一个Worker进程工做。

(3)Master进程主要进行一些全局性的初始化工做和管理Worker的工做;事件处理是在Worker中进行的。

参考文章:

一、http://www.syyong.com/db/Redis-why-the-use-of-single-process-and-single-threaded-way-so-fast.html 
二、http://blog.csdn.net/xxb2008/article/details/42238557 
三、http://blog.csdn.net/hobbs136/article/details/7619719 
四、http://blog.csdn.net/yushitao/article/details/43565851

相关文章
相关标签/搜索