Don’t Just Assume; Look and Answer:Overcoming Priors for Visual Question Answering阅读笔记

许多研究发现,目前的视觉问题回答(VQA)模型在很大程度上是由训练数据的表面相关性驱动的,缺乏足够的图像基础。我们提出了一种新的VQA设置,即针对每种题型,训练和测试集都有不同的答案先验分布。提出了VQA v1和VQA v2数据集的新分割,称之为改变先验下的可视化问题回答(VQA-CP v1和VQA-CP v2)。 1、文章引入 先前的工作所研究的模型当面对一个困难的学习问题时,通常诉诸于锁定训练
相关文章
相关标签/搜索