《Stacked Attention Networks for Image Question Answering》论文阅读

《Stacked Attention Networks for Image Question Answering》论文阅读 摘要 本文介绍了堆叠注意力网络(SANs),它学习从图像中回答自然语言问题,San使用问题的语义表示作为查询来搜索图像中与答案相关的区域,通过多次查询一个映像,在四个图像质量保证数据集上进行的实验表明,该方法明显优于以往的先进方法。 一、介绍 图像中有几个物体:自行车、窗户、
相关文章
相关标签/搜索