视觉语言导航综述Visual Language Navigation

abstract: | 视觉语言导航任务(Visual Language Navigation) 是让智能体跟着自然语言指令进行导航,这个任务需要同时理解自然语言指令与视角中可以看见的图像信息,然后在环境中对自身所处状态做出对应的动作,最终达到目标位置。该问题的难点还有自然语言指令的复杂、包含了当前可见与不可见的信息,环境给的反馈非常模糊使得智能体很难判断自身位置。本文从仿真环境与文本数据来源先简
相关文章
相关标签/搜索