延迟队列的需求各位应该在平常开发的场景中常常碰到。好比:html
用户登陆以后5分钟给用户作分类推送;redis
用户多少天未登陆给用户作召回推送;算法
按期检查用户当前退款帐单是否被商家处理等等场景。数组
通常这种场景和定时任务仍是有很大的区别,定时任务是你知道任务多久该跑一次或者何时只跑一次,这个时间是肯定的。延迟队列是当某个事件发生的时候须要延迟多久触发配套事件,引子事件发生的时间不是固定的。数据结构
业界目前也有不少实现方案,单机版的方案就不说了,如今也没有哪一个公司仍是单机版的服务,今天咱们一一探讨各类方案的大体实现。多线程
这个方案比较经常使用,简单有效。利用 Redis 的 sorted set 结构,使用 timeStamp 做为 score,好比你的任务是要延迟5分钟,那么就在当前时间上加5分钟做为 score ,轮询任务每秒只轮询 score 大于当前时间的 key便可,若是任务支持有偏差,那么当没有扫描到有效数据的时候能够休眠对应时间再继续轮询。架构
方案优劣:异步
优势:工具
简单实用,一针见血。大数据
缺点:
因此,sorted set 的方案并非一个成熟的方案,他只是一个快速可供落地的方案。
下面说一个能够落地的方案,这个方案也被大多数目前在架构中使用了 RabbitMQ 的项目组使用。很差的一点就是,捆绑 RabbitMQ,当你的架构方案是要用别的 MQ 替换 RabbitMQ 的时候,你就蛋疼了(我如今正在经历)。
RabbitMQ 有两个特性,一个是 Time-To-Live Extensions,另外一个是 Dead Letter Exchanges。
Time-To-Live Extensions
RabbitMQ容许咱们为消息或者队列设置TTL(time to live),也就是过时时间。TTL代表了一条消息可在队列中存活的最大时间,单位为毫秒。也就是说,当某条消息被设置了TTL或者当某条消息进入了设置了TTL的队列时,这条消息会在通过TTL秒后 “死亡”,成为Dead Letter。若是既配置了消息的TTL,又配置了队列的TTL,那么较小的那个值会被取用。
Dead Letter Exchanges
在 RabbitMQ 中,一共有三种消息的 “死亡” 形式:
basic.reject
或者 basic.nack
而且设置的 requeue
参数为 false;DLX同通常的 Exchange 没有区别,它能在任何的队列上被指定,实际上就是设置某个队列的属性。当队列中有 DLX 消息时,RabbitMQ就会自动的将 DLX 消息从新发布到设置的 Exchange 中去,进而被路由到另外一个队列,publish 能够监听这个队列中消息作相应的处理。
由上简介你们能够看出,RabbitMQ自己是不支持延迟队列的,只是他的特性让勤劳的 中国脱发群体 急中生智(为了完成任务)弄出了这么一套可用的方案。
可用的方案就是:
方案优劣:
优势:
大品牌组件,用的放心。若是面临大数据量需求能够很容易的横向扩展,同时消息支持持久化,有问题可回滚。
缺点:
HashedWheelTimer
是 Netty 中 的一个基础工具类,主要用来高效处理大量定时任务,且任务对时间精度要求相对不高, 在Netty 中的应用场景就是链接超时或者任务处理超时,通常都是操做比较快速的任务,缺点是内存占用相对较高。
算法思想
HashedWheelTimer
主要仍是一个 DelayQueue
和一个时间轮算法组合。
Hash Wheel Timer
是一个环形结构,能够想象成时钟,分为不少格子,一个格子表明一段时间(越短Timer精度越高),并用一个List保存在该格子上到期的全部任务。同时一个指针随着时间流逝一格一格转动,并执行对应List中全部到期的任务。
以上图为例,假设一个格子是1s,则整个时间轮能表示的时间段16s。当前任务指向格子2,代表在第2s的时候有任务须要执行。任务列表中有两个任务,每一个任务前面的数字表示圈数。2表示当走到第2圈的时候才会执行,那么整个任务的真正执行时间实际上是在12s以后执行,即第二圈走到2的时候。每推动一格,对应的每个 slot 中的round数都要减一。总体算法就是这么个逻辑。
时间轮设计要点:
须要注意的是,这种方式任务是串行执行的。意味着你若是在时间轮中执行任务且任务耗时较长,将会出现调度超时或者任务堆积的状况。因此要将任务的执行异步化。
算法的要点:
Netty 使用数组 + 双向链表
的方式来组织时间轮,对于添加/取消操做仅作了记录,真正的操做实际发生在下一个tick。时间的推动是独立的线程在作,该线程同时也负责过时任务的执行等操做,可简单认为此步骤操做为O(n),由于推动线程须要彻底遍历timeouts
、cancelledTimeouts
与bucket
链表,在遍历timeouts
时,Netty为了不任务过多,因此限制每次最多遍历10万个,也就是说,一个tick只能规划10万个任务,当任务量过大时,会存在超时任务执行时间延迟的现象。
方案优劣:
优势:
实现比较优雅。效率高。
缺点:
目前我了解到的延迟队列在生产环境下有如上三种实现方式,每一种都有人在使用。固然没有最好的只有最适合的,你以为 redis 能知足需求,就按照最简单的来,你要是有充足的开发周期,你也能够实现时间轮展示实力。
需求千万种,变化就一种:给时间都能作。