论文笔记 Visual Question Answering with Memory-Augmented Networks(CVPR2018)

这是沈春华老师小组的一篇文章。 这篇文章的出发点是:目前的VQA问题,由于answer数量的有限性,因此转化为一种分类问题,但由于部分answer出现 的频次较低(比如上图中的黄瓜),为了提高整体的分类准确率,往往进行分类的时候,将频次低的answer进行舍弃, 如取answer出现频次高的top1000,。基于这种现象,本文提出Memory-Augmented Network来处理这样一种长尾效
相关文章
相关标签/搜索