在2018 AI开发者大会(AI NEXTCon)上,美团配送AI方向负责人何仁清,分享了美团在即时配送领域中机器学习技术的最新进展,以及如何经过大数据和机器学习手段,创建对线下真实世界各类场景的感知能力,还原并预测配送过程各个细节,从而提高总体配送系统的精度。算法
2014年,斯嘉丽·约翰逊主演的科幻片《超体》大火,影片中主人公Lucy因为无心中摄入了大量的代号为“CPH4”的神秘药物,大脑神经元得到空前的开发,得到了异乎寻常的超能力,她可以对这个世界进行全新的感知、理解和控制(好比控制无线电波),最终跨越时间和空间成为了一个超级个体。安全
这种对真实世界的深度感知、理解和控制,与配送AI系统对配送场景的感知、理解和配送环节控制的目标很是一致。能够说,美团要建设的AI就是配送系统的“超级大脑”。所以咱们内部把配送的AI系统,简称为“超脑”配送系统。网络
最近几年,之外卖为依托,即时配送业务在全球范围内掀起了一波快速发展的浪潮,全球各地都出现了不少创业公司,其中国外知名的包括美国的Uber Eats(全球)、英国的Deliveroo、印度的Swiggy、Zomato(分别被美团和阿里投资),印尼的go-jek等等。国内除了美团外卖、饿了么、滴滴外卖等典型表明外,而还有专一于即时配送服务创业公司,好比闪送、UU跑腿、达达、点我达等。机器学习
这种全球爆发的现象说明了两个问题:学习
即时配送,是一种配送时长1小时之内,平均配送时长约30分钟的快速配送业务。如此快速的配送时效,将传统的线上电商交易与线下物流配送(传统划分比较明确的两条业务)整合为统一总体,造成了用户、商户、骑手和平台互相交错的四元关系。大数据
其整协力度空前紧密,几乎渗透到各个环节。之外卖搜索和排序为例,在下午时段,在用户搜索和推荐中能够看到更多的商家,由于此时运力充分,能够提供更远距离的配送服务,不只能更好知足用户的需求,提升商家的单量,并且可以增长骑手的收入。优化
即时配送的核心指标是效率、成本、体验,这三者也造成了即时配送的商业模型。简单来讲能够分为如下几步:3d
这样,就造成了一个正向循环,不断创造更多商业价值。而技术的做用,就是加速这个正向循环。cdn
目前互联网技术,很大部分仍是针对线上产品和系统研发,整个流程能够在线上所有完成,而这也正是配送AI技术最大的不一样和挑战。简单来讲,相似搜索、推荐、图象和语音识别这种线上产品经常使用的AI技术帮助不大,由于配送必须在线下一个一个环节的进行,这就要求AI技术必须可以面对复杂的真实物理世界,必须能深度感知、正确理解与准确预测、并瞬间完成复杂决策。blog
为了知足这些要求,咱们建设了美团“超脑”配送系统,包含如下几个方面:
如何构建一个在真实物理世界运行的AI系统,就是咱们最大的挑战。具体到机器学习方向而言,挑战包括如下几个方面:
精度足够高、粒度足够细
线下数据质量的巨大挑战
ETA(Estimated Time of Arrival,时间送达预估)是配送系统中很是重要参数,与用户体验、配送成本有直接关系,并且会直接影响调度系统和订价系统的最终决策。
一个订单中涉及的各类时长参数(如上图右侧所示),能够看到有十几个关键节点,其中关键时长达到七个。这些时长涉及多方,好比骑手(接-到-取-送)、商户(出餐)、用户(交付),要经历室内室外的场景转换,所以挑战性很是高。
经过机器学习方法,咱们已经将外卖配送几乎全部环节都进行了精准预估预测。用户感知比较明显是预计送达时间,贯穿多个环节,商家列表(从配送时长角度让用户更好选择商家)、订单预览(给用户一个准确的配送时间预期)、实时状态(下单后实时反馈最新的送达时间)。固然这里面还有不少用户看不到的部分,好比商家出餐时间、骑手到店时间、交付时间等。其中交付时长,与用户关系比较大,也颇有意思,下文会详细展开。
交付时长是指骑手到达用户后,将外卖交付到用户手中并离开的时间,实际是须要考虑三维空间内计算(上楼-下楼)。交付时间精准预估,有两点重要的意义,首先是客观的衡量配送难度,给骑手合理补贴;其次,考虑对骑手身上后续订单的影响,防止调度不合理,致使其余订单超时。
交付时长的目标是,作到楼宇和楼层的精准颗粒度,具体能够拆解为如下几步:
能够看到,真实世界中影响决策因素很是多,咱们目前作的还不够。好比交付时长也能够进一步细化,好比准确预估骑手上楼时间、下楼时间和等待时间,这样其实可以与商家取餐环节保持一致,之因此没这么作,主要仍是数据缺失,好比骑手在商家其实有两个操做数据(到店、取餐),这样能支持咱们作精细化预估的,可是在用户环节只有(送达)一个操做。
举这个例子,实际上是想说明,数据的完备性对咱们到底有多重要。数据方面的挑战,线下业务与线上业务相比,要高出好几个等级。
地图对配送的重要性毋庸置疑(位置和导航都不许确,配送如何进行?),前面提到的5级地址库只是其中一部分。配送地图的目标能够归纳为如下两点:
若是横向对比配送、快递、打车等行业对地图的要求,实际上是一件颇有意思的事情,这个对于配送地图技术建设来讲,是一件很是有帮助的事情。
从这两方面对比能够看到,在即时配送业务中,骑行地图的重要性很是之高,同时不少问题确实很是具备行业特点,经过驾车地图的技术没法颇有效的解决。这样就须要建设一套即时配送业务地图的解决方案。
如前文所述,配送地图的方向有不少,此次我重点讲一下用户位置相关的工做“交付点挖掘”。首先看一下目前主要问题:用户位置信息有不少错误,好比:
上图左,一个小区会有1期2期~N期等,用户在选择POI的时候就可能发生错误(好比1期的选了2期),二者地理位置相差很是远,很容易形成骑手去了错误的地方。这样在订单发送到配送系统的时候,咱们须要作一次用户坐标纠正,引导骑手到达正确的位置。
上图右,用户原本在xx区xx栋,可是只选了xx区这个比较粗的位置信息。现实中在一个小区里面,找到一个具体xx栋楼仍是很是困难的,你们能够想一想本身小区中,随便说一个楼号你知道它在哪一个角落吗,更别说若是是大晚上在一个你不熟悉的小区了。形成这种缘由,一方面多是用户选择不精细,还有一种可能,就是地图上没有具体楼栋的POI信息。
在实际配送中,咱们都会要求骑手在完成交付后进行签到,这样就会积累大量的上报数据,对于后续进行精细化挖掘很是有帮助。你们能够先看看咱们收集的原始数据(上图),虽然仍是很是凌乱,可是已经能看到这其中蕴含着极高的价值,具体来讲有三方面:
在数据挖掘实际过程当中,其实并无什么“高大上”的必杀技,没法使用流行的End2End方法,基本上仍是须要对各个环节进行拆解,扎扎实实的作好各类基础工做,基本整个挖掘过程,分为如下几个步骤:(1)基于地址分组;(2)数据去噪;(3)数据聚合;(4)置信度打分。其中主要技术挑战,主要在各类场景中保证数据挖掘质量和覆盖率,具体来讲主要有三个挑战:
目前,咱们已经上线了一版交付点,对用户位置进行主动纠正,让骑手能够更准确更快的找到用户。目前效果上看仍是很是明显的。包括几个方面:
前面提到的地图技术,只能解决在室外场景的位置和导航问题。但配送在商家侧(到店、取餐)和用户侧(到客、交付)两个场景中,实际上是发生在室内环境。在室内的骑手位置是在哪里、在作什么以及用户和商家在作什么,若是了解这些,就能解决不少实际问题。好比:
这个技术方向能够统称为“情景感知”,目标就是还原配送场景中(主要是室内以及GPS不许确),真实配送过程发生了什么,具体方向以下图所示:
情景感知的目标就是作到场景的精细刻画(上图的上半部分),包含两个方面工做:
这些数据,大部分来至于手机,可是随着各类智能硬件的普及,好比蓝牙设备,智能电动车、智能头盔等设备的普及,咱们能够收集到更多数据的数据。WiFi/蓝牙技术,以及运动状态识别的技术比较成熟,这里主要说一下概况,本文不作深刻的探讨。
对于配送系统来讲,比较大的挑战仍是对识别精度的要求以及成本之间的平衡。咱们对精度要求很高,毕竟这些识别直接影响订价、调度、判责系统,这种底层数据,精度不高带来的问题很大。
考虑成本限制,咱们须要的是相对廉价和通用的解决方案,那种基于大量传感器硬件部属的技术,明显不适用咱们几百万商家,几千万楼宇这种量级的要求。为此,在具体技术方面,咱们选用的是WiFi指纹、蓝牙识别、运动状态识别等通用技术方案,就单个技术而言,其实学术界已经研究很充分了,并且也有不少应用(好比各类智能手环等设备)。对于咱们的挑战在于要作好多种传感器数据的融合(还包括其余数据),以确保作到高识别精度。固然为了解决“Ground Truth”问题,部署一些稳定&高精度的智能硬件仍是必须的,这对技术迭代优化和评估都很是有帮助。
美团外卖日订单量超过2400万单,已经占有了相对领先的市场份额。美团配送也构建了全球领先的即时配送网络,以及行业领先的美团智能配送系统,智能调度系统每小时路径计算可达29亿次。如何让配送网络运行效率更高,用户体验更好,是一项很是困难的挑战,咱们须要解决大量复杂的机器学习和运筹优化等问题,包括ETA预测,智能调度、地图优化、动态订价、情景感知、智能运营等多个领域。过去三年来,美团配送AI团队研发效果显著,配送时长从一小时陆续缩短到30分钟,而且还在不断提高,咱们也但愿经过AI技术,帮你们吃得更好,生活更好。
目前,即时配送业务正处于快速发展期,新的场景、新的技术问题不断涌现,团队正在迅速扩大中,急需机器学习资深专家、运筹优化技术专家、LBS算法工程师、NLP算法工程师,咱们期待你的加入。扫码可查看职位详情,或者发送简历至 yewei05@meituan.com