论文解读:From Pixels to Objects: Cubic Visual Attention for Visual Question Answering

这是关于VQA问题的第十一篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:From Pixels to Objects: Cubic Visual Attention for Visual Question Answering 1,主要思想 作者提出一般的Spatial visual attention只是选出了最关注的视觉对象,在通道上采用的相同的权重,这不符合
相关文章
相关标签/搜索