如何实现延迟队列

延迟队列的需求各位应该在平常开发的场景中常常碰到。好比:html

用户登陆以后5分钟给用户作分类推送;redis

用户多少天未登陆给用户作召回推送;算法

按期检查用户当前退款帐单是否被商家处理等等场景。数组

通常这种场景和定时任务仍是有很大的区别,定时任务是你知道任务多久该跑一次或者何时只跑一次,这个时间是肯定的。延迟队列是当某个事件发生的时候须要延迟多久触发配套事件,引子事件发生的时间不是固定的。数据结构

业界目前也有不少实现方案,单机版的方案就不说了,如今也没有哪一个公司仍是单机版的服务,今天咱们一一探讨各类方案的大体实现。多线程

1. Redis zset

这个方案比较经常使用,简单有效。利用 Redis 的 sorted set 结构,使用 timeStamp 做为 score,好比你的任务是要延迟5分钟,那么就在当前时间上加5分钟做为 score ,轮询任务每秒只轮询 score 大于当前时间的 key便可,若是任务支持有偏差,那么当没有扫描到有效数据的时候能够休眠对应时间再继续轮询。架构

方案优劣异步

优势:工具

简单实用,一针见血。大数据

缺点:

  1. 单个 zset 确定支持不了太大的数据量,若是你有几百万的延迟任务需求,大哥我仍是劝你换一个方案;
  2. 定时器轮询方案可能会有异常终止的状况须要本身处理,同时消息处理失败的回滚方案,您也要本身处理。

因此,sorted set 的方案并非一个成熟的方案,他只是一个快速可供落地的方案。

2. RabbitMQ队列

下面说一个能够落地的方案,这个方案也被大多数目前在架构中使用了 RabbitMQ 的项目组使用。很差的一点就是,捆绑 RabbitMQ,当你的架构方案是要用别的 MQ 替换 RabbitMQ 的时候,你就蛋疼了(我如今正在经历)。

RabbitMQ 有两个特性,一个是 Time-To-Live Extensions,另外一个是 Dead Letter Exchanges

  • Time-To-Live Extensions

    RabbitMQ容许咱们为消息或者队列设置TTL(time to live),也就是过时时间。TTL代表了一条消息可在队列中存活的最大时间,单位为毫秒。也就是说,当某条消息被设置了TTL或者当某条消息进入了设置了TTL的队列时,这条消息会在通过TTL秒后 “死亡”,成为Dead Letter。若是既配置了消息的TTL,又配置了队列的TTL,那么较小的那个值会被取用。

  • Dead Letter Exchanges

    在 RabbitMQ 中,一共有三种消息的 “死亡” 形式:

    1. 消息被拒绝。经过调用 basic.reject 或者 basic.nack 而且设置的 requeue 参数为 false;
    2. 消息由于设置了TTL而过时;
    3. 队列达到最大长度。

DLX同通常的 Exchange 没有区别,它能在任何的队列上被指定,实际上就是设置某个队列的属性。当队列中有 DLX 消息时,RabbitMQ就会自动的将 DLX 消息从新发布到设置的 Exchange 中去,进而被路由到另外一个队列,publish 能够监听这个队列中消息作相应的处理。

由上简介你们能够看出,RabbitMQ自己是不支持延迟队列的,只是他的特性让勤劳的 中国脱发群体 急中生智(为了完成任务)弄出了这么一套可用的方案。

可用的方案就是

  1. 若是有事件须要延迟那么将该事件发送到MQ 队列中,为须要延迟的消息设置一个TTL;
  2. TTL到期后就会自动进入设置好的DLX,而后由DLX转发到配置好的实际消费队列;
  3. 消费该队列的延迟消息,处理事件。

方案优劣

优势:

大品牌组件,用的放心。若是面临大数据量需求能够很容易的横向扩展,同时消息支持持久化,有问题可回滚。

缺点:

  1. 配置麻烦,额外增长一个死信交换机和一个死信队列的配置;
  2. RabbitMQ 是一个消息中间件,TTL 和 DLX 只是他的一个特性,将延迟队列绑定在一个功能软件的某一个特性上,可能会有风险。不要杠,当大家组不用 RabbitMQ 的时候迁移很痛苦;
  3. 消息队列具备先进先出的特色,若是第一个进入队列的消息 A 的延迟是10分钟,第二个进入队列的消息B 的延迟是5分钟,指望的是谁先到 TTL谁先出,可是事实是B已经到期了,而还要等到 A 的延迟10分钟结束A先出以后,B 才能出。因此在设计的时候须要考虑不一样延迟的消息要放到不一样的队列。另外该问题官方已经给出了插件来支持:插件地址

3. 基于 Netty#HashedWheelTimer类方法的实现

HashedWheelTimer 是 Netty 中 的一个基础工具类,主要用来高效处理大量定时任务,且任务对时间精度要求相对不高, 在Netty 中的应用场景就是链接超时或者任务处理超时,通常都是操做比较快速的任务,缺点是内存占用相对较高。

算法思想

HashedWheelTimer 主要仍是一个 DelayQueue 和一个时间轮算法组合。

Hash Wheel Timer是一个环形结构,能够想象成时钟,分为不少格子,一个格子表明一段时间(越短Timer精度越高),并用一个List保存在该格子上到期的全部任务。同时一个指针随着时间流逝一格一格转动,并执行对应List中全部到期的任务。

以上图为例,假设一个格子是1s,则整个时间轮能表示的时间段16s。当前任务指向格子2,代表在第2s的时候有任务须要执行。任务列表中有两个任务,每一个任务前面的数字表示圈数。2表示当走到第2圈的时候才会执行,那么整个任务的真正执行时间实际上是在12s以后执行,即第二圈走到2的时候。每推动一格,对应的每个 slot 中的round数都要减一。总体算法就是这么个逻辑。

时间轮设计要点:

  • tick,一次时间推动,每次推动会检查/执行超时任务;
  • tickDuration,时间轮推动的最小单元,每隔 tickDuration 会有一次 tick,它决定了时间轮的精确程度;
  • bucket(ticksPerWheel),上图中的每一隔就是一个bucket,表示一个时间轮能够有多少个tick,它是存储任务的最小单元;
  • 上层时间轮的 tickDuration 是下层时间轮的表示时间的最大范围,即:父 tickDuration = 子 tickDuration * 子 bucket 。

须要注意的是,这种方式任务是串行执行的。意味着你若是在时间轮中执行任务且任务耗时较长,将会出现调度超时或者任务堆积的状况。因此要将任务的执行异步化。

算法的要点:

  1. 任务并非直接放在格子中的,而是维护了一个双向链表,这种数据结构很是便于插入和移除;
  2. 新添加的任务并不直接放入格子,而是先放入一个队列中,这是为了不多线程插入任务的冲突。在每一个tick运行任务以前由worker线程自动对任务进行归集和分类,插入到对应的槽位里面。

Netty 使用数组 + 双向链表的方式来组织时间轮,对于添加/取消操做仅作了记录,真正的操做实际发生在下一个tick。时间的推动是独立的线程在作,该线程同时也负责过时任务的执行等操做,可简单认为此步骤操做为O(n),由于推动线程须要彻底遍历timeoutscancelledTimeoutsbucket链表,在遍历timeouts时,Netty为了不任务过多,因此限制每次最多遍历10万个,也就是说,一个tick只能规划10万个任务,当任务量过大时,会存在超时任务执行时间延迟的现象。

方案优劣

优势:

实现比较优雅。效率高。

缺点:

  1. 没法实现HA和横向扩展,要么就使用多个时间轮。
  2. 最重要的是,实现也比较复杂,开发者须要考虑全部可能的状况。

目前我了解到的延迟队列在生产环境下有如上三种实现方式,每一种都有人在使用。固然没有最好的只有最适合的,你以为 redis 能知足需求,就按照最简单的来,你要是有充足的开发周期,你也能够实现时间轮展示实力。

需求千万种,变化就一种:给时间都能作。

相关文章
相关标签/搜索