视觉场景理解论文阅读笔记:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

时间 2020-12-30

原文原文链接

一、文章相关资料 1.论文地址:点击打开链接 2.论文代码:点击打开链接 3.发表时间:2018 二、阅读笔记 1.论文思想文章提出一种自上而下与自下而上相结合的注意力模型方法，应用于视觉场景理解和视觉问答系统的相关问题。其中基于自下而上的关注模型（一般使用Faster R-CNN）用于提取图像中的兴趣区域，获取对象特征；而基于自上而下的注意力模型用于学习特征所对应的权重（一般使

>>阅读原文<<