AutoML:自动设计自动驾驶机器学习模型

译者说

本人介绍了谷歌自动驾驶子公司Waymo在AutoML领域的研究成果。自动驾驶对神经网络模型的准确性和延迟要求,这要求工程师手动调优不一样的神经网络架构,这不只花费了大量的时间,并且可以调优的数量是有限的。所以,Waymo和Google AI的研究员合做,自动生成神经网络架构并训练评估,即AutoML,以便节约时间并寻找最佳模型。本文介绍了他们的初步研究成果,从取得的进展来看,将来可期。git

正文

By: Shuyang Cheng and Gabriel Bendergithub

在Waymo,机器学习几乎在咱们自动驾驶系统的每一个模块都起着关键做用。它能够帮助咱们的汽车看清周围的环境、感知世界、预测其余人的行为,并决定本身下一步最佳移动。算法

采起感知:咱们的系统组合多个神经网络,使车辆可以解释传感器数据以识别物体,并随着时间的推移跟踪它们,以便车辆可以深刻理解周围的世界。建立这些神经网络一般是一项耗时的任务; 咱们要优化神经网络架构,以使网络的质量和速度知足在自动驾驶汽车上运行,这是一个复杂的微调过程,一项新任务的调优一般花费工程师数月时间。安全

如今,咱们与Brain团队的Google AI研究员合做,将前沿研究付诸实践来自动生成神经网络。更重要的是,这些自动生成的神经网络比工程师手动调优的网络具备更高的质量和更快的速度。服务器

为了把咱们的自动驾驶技术带到不一样的城市和环境,咱们须要以极快的速度优化咱们的模型以适应不一样的场景。AutoML让咱们作到这一点,它提供了大量的有效且持续的ML解决方案。网络

迁移学习:使用现有的AutoML架构

咱们的合做始于一个简单的问题:AutoML可否为汽车生成高质量和低延迟的神经网络架构

质量衡量神经网络的准确性。延迟衡量神经网络的速度,它也称为推理时间。因为驾驶是一项须要车辆实时反馈、系统足够安全的关键活动,所以咱们的神经网络须要低延迟运行。咱们大部分直接运行在车辆上的神经网络提供结果的延迟小于10ms,这比在数据中心数千台服务器上运行的许多神经网络快。app

在他们的第一版AutoML论文中,咱们的Google AI同事可以自动探索超过12000种架构来解决经典的CIFAR-10图像识别任务:将小图像识别为十个类别中的一个,例如汽车、飞机、狗等。在一篇后续文章中,他们发现了一组神经网络构建模块,称之为NAS单元,对于CIFAR-10和相似的任务,NAS单元自动构建的神经网路比手工调优的要好。经过此次合做,咱们的研究人员决定使用这些单元自动构建针对自动驾驶任务的新模型,从而将在CIFAR-10上学到的知识迁移到自动驾驶领域。咱们的第一个实验是语义分割任务:将LiDAR点云中的每一个点标识为汽车、行人、树等。dom

One example of a NAS cell. This cell processes inputs from the two previous layers in a neural net.

为此,咱们的研究员编写了一个自动搜索算法,在卷积网络架构(CNN)中探索数百种不一样的NAS单元组合,训练和评估咱们的LiDAR分割任务模型。当咱们的工程师手工微调这些神经网络时,他们只能探索有限数量的架构,但经过这种方法,咱们自动探索了数百个架构。咱们发现新的模型在如下两方面优于之前手工调优的模型:机器学习

  • 质量类似,但延迟显着下降。
  • 延迟类似,但质量更高。

鉴于初步尝试取得的成功,咱们将相同的搜索算法应用于两个与交通车道的检测和定位相关的附加任务。迁移学习技术也适用于这些任务,而且咱们可以在汽车上部署三个新训练和改进的神经网络。

端到端搜索:从头开始的新搜索架构

咱们受到这些初步结果的鼓舞,所以决定寻找能够提供更好结果和更普遍应用的全新架构。经过无限制组合已发现的NAS单元,咱们能够更直接地寻找知足严格的延迟要求的架构。

进行端到端搜索一般须要手动探索数千种架构,会带来大量的计算成本。探索单一架构须要在具备多个GPU的数据中心计算机上进行数天的训练,这意味着单个任务找到理想的架构须要数千天的计算。所以咱们设计了一个代理任务:缩小的LiDAR分割任务,能够在几小时内完成训练。

团队必须克服的一个挑战是找到一个相似于咱们原始分割任务的代理任务。在咱们可以肯定新任务架构的质量与原始任务中架构的质量之间的关联以前,咱们尝试设计了几个代理任务。而后,咱们启动了相似于第一版AutoML论文中的搜索算法,但如今用在代理任务上进行搜索:代理端到端搜索。这是该概念首次应用于LiDAR数据。

Proxy end-to-end search: Explore thousands of architecture on a scaled-down proxy task, apply the 100 best ones to the original task, validate and deploy the best of the best architectures on the car.

咱们使用了几种搜索算法来优化质量和延迟,由于这对车辆相当重要。咱们查看不一样类型的CNN架构并使用不一样的搜索策略,例如随机搜索和强化学习,咱们为代理任务探索10000多种不一样的架构。经过使用代理任务,原来在Google TPU集群上须要一年多计算时间的任务如今只须要两周时间。咱们刚开始迁移NAS单元时就发现了比之前更好的神经网络:

  • 延迟下降20-30%,质量相同。
  • 质量更高,错误率下降8-10%,与以前的架构具备相同的延迟。

1) The first graph shows about 4,000 architectures discovered with a random search on a simple set of architectures. Each point is an architecture that was trained and evaluated. The solid line marks the best architectures at different inference time constraints. The red dot shows the latency and performance of the net built with transfer learning. In this random search, the nets were not as good as the one from transfer learning.
2) In the second graph, the yellow and blue points show the results of two other search algorithms. The yellow one was a random search on a refined set of architectures. The blue one used reinforcement learning as in [1] and explored more than 6,000 architectures. It yielded the best results. These two additional searches found nets that were significantly better than the net from transfer learning.

搜索中发现的一些网络架构显示了卷积、池化和反卷积操做的创造性组合,以下图所示。这些架构最终适用于咱们最初的LiDAR分割任务,并将部署在Waymo的自动驾驶车辆上。

One of the neural net architectures discovered by the proxy end-to-end search.

下一步呢?

咱们的AutoML实验只是一个开始。对于咱们的LiDAR分割任务,迁移学习和代理端到端搜索都提供了比手工调优更好的神经网络。咱们如今有机会将这些机制应用于新类型的任务,这能够改善许多神经网络。

这一发展为咱们将来的ML工做开辟了新的使人兴奋的途径,并将改善咱们自动驾驶技术的性能和能力。咱们期待与Google AI进一步工做,敬请期待!

致谢

Waymo和Google之间的合做由Waymo的Matthieu Devin和Google的Quoc Le发起和赞助。这项工做由Waymo的Shuyang Cheng和Google的Gabriel Bender以及Pieter-jan Kindermans执行。特别感谢Vishy Tirumalashetty的支持。

Members of the Waymo and Google teams (from left): Gabriel Bender, Shuyang Cheng, Matthieu Devin, and Quoc Le

说明

参考文献

  • Barret Zoph and Quoc V. Le. Neural architecture search with reinforcement learning. ICLR, 2017.
  • Barret Zoph, Vijay Vasudevan, Jonathon Shlens, Quoc V. Le, Learning Transferable Architectures for Scalable Image Recognition. CVPR, 2018.
相关文章
相关标签/搜索