论文浅尝 - CVPR2020 | 基于网格特征的可视问答系统

论文笔记整理:李爽,天津大学。 链接:https://arxiv.org/pdf/2001.03615v1.pdf 动机 随着“自下而上”注意力的普及,基于边界框(或区域)的视觉特征最近已经超越了传统的基于网格的卷积特征,成为视觉和语言任务的事实标准。然而,目前尚不清楚区域优势是否是自下而上的注意力成功的关键原因。作者重新审视了用于VQA的网格特性,发现它们的性能令人惊讶——在同样的精度下,运行速
相关文章
相关标签/搜索