简介: 相信大部分人都有点过外卖的经历。在饿了么,为了让骑手可以准时准点将外卖送到每位用户的手中,让每位用户吃上一口热乎饭,阿里本地生活智慧物流团队对外卖履约时间预估这一问题进行了深刻研究,并给出了有效的解决方案,本文将为你们作一个简要介绍。算法
近日,阿里本地生活智慧物流团队的一篇论文——Order Fulfillment Cycle Time Estimation for On-Demand Food Delivery被KDD’2020 Applied Data Science Track接收为Oral presentation(ACM Knowledge Discovery and Data Mining(SIGKDD),CCF A类会议,数据挖掘领域顶级会议,2020 年的口头报告接受率为 5.8%)。网络
外卖履约时间预估(OFCT:Order Fulfillment Cycle Time)问题相比通常的时间预估问题而言更为复杂,其中存在餐厅与用户的供需关系、餐厅出餐时间的未知性以及骑手行为的不肯定性等问题。在论文中咱们向学术界首次详细介绍外卖履约时间预估这一问题,并给出了有效的解决方案,最后获得了审稿人的一致承认。框架
经过逐步拆解整个外卖履约(履约:饿了么平台保障骑手可以将外卖准时送达给用户)的过程,咱们分析了外卖履约时间预估相比常见的其余送达时间问题(例如打车)的显著差别,并针对影响履约时间长短的特征进行了解释和说明。对于用户而言可能只是看到外卖须要多久才能吃到,而在这背后须要咱们提炼出丰富的影响因素,来保证履约时间预估的准确性。咱们将这些影响因素输入深度神经网络来推断它们和履约时长的关系,同时咱们进一步引入了餐厅、用户地址以及骑手的隐向量来加强模型的预测性能。最后,咱们提出一个新颖的后处理神经网络算子,用于改善模型的收敛速度和准确度。咱们所介绍的模型已在饿了么实际部署,天天服务于千万用户。分布式
履约时间预估模型预估的是从用户下单到骑手将订单送达用户手上的这段时间(即预计送达时间)。饿了么平台天天产生千万级订单量,时间预估做为即时配送的其中一环,既影响用户体验同时也涉及到骑手履约,所以其准确性对平台而言相当重要,既不能预估的太长(影响用户体验),也不能预估的过短(骑手没法按时完成配送)。下图为时间预估涉及的各个环节。函数
主要环节包括:性能
下图即为你们平常在饿了么上面点外卖的时候可以看到的信息,其中配送时间就是咱们履约时间预估模型计算出的。学习
Estimated Time of Arrival (ETA)即“预估送达时间”,通常预估的是从出发地到目的地的时间,打车场景中的预估送达时间即为一类典型的ETA问题。测试
本文提出的外卖履约时间预估模型,预估的是从用户下单开始到骑手将餐品送达用户手中所花的时间,用户在饿了么点了外卖之后,订单在平台开始流转的过程以下图所示。编码
外卖履约时间预估相比预估送达时间而言更为特殊,主要体如今如下两方面:spa
1 须要考虑更多影响因素
通常的预估送达时间问题仅需考虑天气、交通情况,时空信息及路径信息等,而外卖履约时间预估问题除了考虑此类信息外,还需考虑餐厅的地理位置,餐厅订单备餐时间以及调度系统派单等信息。
2 没法获取关键信息
用户下单成功时饿了么已经为用户预估出预计送达时间,而此时订单并未被骑手接单,骑手须要被系统指派才能开始取餐和配送,所以咱们没法提早获取骑手的信息及其实际的配送路径。
以上两方面的差别给外卖履约时间预估问题的准确性带来极大的挑战。
为了建模外卖履约时间,通常须要充分利用与订单信息相关的数据,具体包括:
你们应该会好奇订单价格会对外卖时间长短形成什么影响?当用户下单的金额较高时一般餐品对应的重量或体积较大,好比用户预订了蛋糕或者集体点了不少杯奶茶,这种总金额高的订单对于骑手而言属于难配送订单,所以须要花费较长的履约时间。下图(b)展现出了这种相关性,能够看到订单价格的高低在必定程度上能够刻画出订单是否难配送的隐含信息。
从平台角度看,用户下单量和餐厅接单量不一样时刻都在发生剧烈变化,这种供需维度上的变化对实际配送时长会形成极大影响。
在介绍供需特征构造的工做前,先为你们介绍外卖配送中“波次”的概念:对于骑手身上的一组订单,对给定的一组订单取送顺序进行分组,保证每组中全部相关订单的取和送行为都在该组中,该分组则为骑手当前配送的波次。针对供需变化,咱们构造了基于时段的供需比和完成率等特征。当供需比越高时波次的平均长度会变长,此时履约时间越长。
另外一方面当完成率越高时能够推断出骑手完成配送的订单越多,此时骑手能够继续承接系统接下来分派的订单。
此外,咱们经过餐厅当前待取餐单量(餐厅接单后等待骑手来取的订单数)来刻画餐厅的繁忙程度,当餐厅接单数变多而产能受限时会致使订单积压,此时若是骑手已经到达餐厅则须要花费较长的等待时间才能取到餐品,相应的当餐厅变繁忙时,模型预估的履约时间将变长。
订单的出餐时间是外卖履约时间预估模型的一个重要影响因素,这个特征咱们是经过聚合餐厅的历史出餐时间获得的。但目前存在的难点问题对出餐时间计算的准确性带来极大考验,主要包括:
在实际运用时,咱们是根据商家接单时间到骑手实际点击取餐时间来计算商户的真实出餐时间,而这其中存在一部分噪音数据:
此外,对于一部分训练样本,咱们认为骑手在取到餐品时实际上餐厅已经备餐完成,例如骑手晚取餐或骑手同时点击取多餐。针对这些数据咱们在计算餐厅出餐时间特征时进行了必定比例的剔除。
饿了么从平台角度出发,将每一个城市划分红了以“网格”为最小单元的不一样区域,每一个蜂鸟配送站点内的骑手会服务于站点周边范围内固定的若干个网格,骑手对站点辐射的网格内的商圈或者小区的熟悉程度决定了其配送效率。从下图你们能够看到,由于骑手对餐厅所在位置、用户所在小区都比较熟悉,所以在取餐或者配送的过程当中并无发生绕路的状况。
而用户下单成功时饿了么App会马上为用户显示外卖预估履约时间,此时订单指派给具体哪位骑手来配送是未知的。为了充分利用与骑手相关的影响因素,咱们根据骑手取餐距离、骑手当前接了多少订单等特征来表征订单可能被接单的每一位骑手,而后将可能接单的骑手序列进行特征编码传入外卖履约时间预估模型中,随后利用注意力机制提取骑手序列信息,以此来加强模型的预测能力。
配送段ETA指的是预估骑手到达目的地(用户所在位置)附近下车后将餐品送到用户手中所花的时间,是骑手配送的最终环节。
为了估算配送段ETA,咱们理论上能够直接采用回归模型来学习,可是经常使用的回归模型一般将输入转化为一系列的特征,而且经过有监督学习找到这些影响因素和输出目标之间的关系,为了方便学习和提升模型泛化能力一般基于神经网络和集成树模型将这些关系参数化为一个平滑的函数,但这种平滑假设的缺点是没法很好的处理长尾不规律case,可能会影响用户体验。例如当骑手送餐须要乘坐高层电梯时,若是赶上高峰期,可能须要等待很长的时间,而系统很难作到这种实时的预判。从下图能够看出,骑手送餐时在楼内花了7.6分钟。
为了部分缓解这种问题,咱们借鉴了近期基于记忆的语言模型[1]的思想,将历史订单做为配送段时间预估的语料,经过构造多维特征来表征每一个历史订单,当新的订单产生时咱们基于K近邻来搜索出与新订单类似的若干个历史订单,而后对这若干个类似单的真实配送段时间作加权平均,以此做为新订单的预估配送段时间。最终咱们将基于K近邻搜索出的预估配送段时间做为特征输入外卖履约时间预估模型中。
时间预估本质上属于回归问题,在训练模型的过程当中咱们发现模型收敛较慢且交叉验证的表现偏离预期,经过分析缘由咱们发现模型拟合的数据分布与真实履约时间的分布发生了偏移,真实的履约时间其实是一个右偏长尾的分布,至关于有一小部分订单真实的配送时间偏长而模型没有学习到,针对此问题在本文中咱们提出了一个新颖的后处理神经网络算子,针对外卖履约时间预估模型的拟合结果进行缩放和变换,用于改善模型的收敛速度和准确度。此后处理算子可描述为:
其中,
通过离线训练验证,后处理算子可有效提高外卖履约时间预估模型收敛速度和准确度。
近期,咱们又探索出一种新的后处理算子:自适应Box-Cox逆变换,相比于本文提出的后处理算子,自适应Box-Cox逆变换算子更加可以拟合长尾数据分布,使模型效果获得了进一步改善,目前此算子已经应用于线上推断。
咱们提出的外卖履约时间预估模型以“编码及预测”做为模型主体结构,具体结构以下图所示。
其中,Nearest Courier Index这个模块实现了前面介绍的骑手信息编码,这个模块可让模型充分利用可能接单的骑手信息;Postprocessing即为后处理算子,这个算子让模型可以更快收敛,同时也提高了模型的准确率。
在咱们提出外卖履约时间预估模型前,线上时间预估模型已经稳定运行了一段时间,所以咱们以线上已有模型做为baseline进行了AB实验。下图实验数据显示,外卖履约时间预估模型相比于原有模型,MAE相对下降9.8%,用户投诉率相对下降19.3%,预测偏差和用户投诉率均有明显改善,对用户体验产生了明显的正向效果。
在本文中咱们为你们介绍了饿了么目前线上实际运行并服务于用户的外卖履约时间预估模型,经过离线评测及在线测试均证实了其有效性。
将来咱们主要将着力于以下两方面继续研究:
参考文献
[1] Urvashi Khandelwal, Omer Levy, Dan Jurafsky, Luke Zettlemoyer, and Mike Lewis. Generalization through memorization: Nearest neighbor language models. In ICLR, 2020.
深度学习课程 | 神经网络概览及算法详解
人工神经网络(Artificial Neural Networks,简写为 ANN)是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。本课程共 36 课时,主要介绍神经网络学习规则、感知神经网络、竞争神经网络及反馈神经网络等,帮助你们掌握神经网络的相关概念和算法模型。
点击“阅读原文”马上学习吧!