ICCV 2019 论文解读 | 基于层次解析的Image Captioning

©PaperWeekly 原创 · 作者|蔡文杰 学校|华南理工大学 研究方向|计算机视觉 目前大多数的 image captioning 模型采用的都是 encoder-decoder 的框架。本文在 encoder 的部分加入了层次解析(Hierarchy Parsing, HIP)结构。HIP 把图片解析成树状结构:根节点是整个图片,中间节点则是通过把图片分解成一系列 Region-leve
相关文章
相关标签/搜索