论文小综 | Using External Knowledge on VQA

本文转载自公众号:浙大KG。 本文作者:陈卓,浙江大学在读博士,主要研究方向为图神经网络和知识图谱表示学习 我们生活在一个多模态的世界中。视觉的捕捉与理解,知识的学习与感知,语言的交流与表达,诸多方面的信息促进着我们对于世界的认知。作为多模态领域一个典型的场景,VQA(视觉问答)顾名思义,也就是结合视觉的信息来回答所提出的问题。其于15年首次被提出[1],涉及的方法从最开始的联合编码,到双线性融合
相关文章
相关标签/搜索