融合CV和NLP的视觉语义导航

时间 2020-12-24

原文原文链接

据说是CVPR2019的满分论文，因为导师项目的方向正好与这篇论文很接近，所以翻译了下论文地址:https://arxiv.org/abs/1811.10092 /// /// 摘要：视觉-语言导航（VLN/vision-language navigation）是引导具身智能体（embodied agent）在真实三维环境中执行自然语言指令的任务。在这篇论文中，我们研究的是如何解决这一任务的三大