融合CV和NLP的视觉语义导航

据说是CVPR2019的满分论文,因为导师项目的方向正好与这篇论文很接近,所以翻译了下 论文地址:https://arxiv.org/abs/1811.10092 /// /// 摘要:视觉-语言导航(VLN/vision-language navigation)是引导具身智能体(embodied agent)在真实三维环境中执行自然语言指令的任务。在这篇论文中,我们研究的是如何解决这一任务的三大
相关文章
相关标签/搜索