视觉场景理解论文阅读笔记:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

一、文章相关资料 1.论文地址:点击打开链接 2.论文代码:点击打开链接 3.发表时间:2018 二、阅读笔记 1.论文思想         文章提出一种自上而下与自下而上相结合的注意力模型方法,应用于视觉场景理解和视觉问答系统的相关问题。其中基于自下而上的关注模型(一般使用Faster R-CNN)用于提取图像中的兴趣区域,获取对象特征;而基于自上而下的注意力模型用于学习特征所对应的权重(一般使
相关文章
相关标签/搜索