ICCV 2019 论文解读 | 基于层次解析的Image Captioning

时间 2020-12-30

原文原文链接

©PaperWeekly 原创 · 作者｜蔡文杰学校｜华南理工大学研究方向｜计算机视觉目前大多数的 image captioning 模型采用的都是 encoder-decoder 的框架。本文在 encoder 的部分加入了层次解析（Hierarchy Parsing, HIP）结构。HIP 把图片解析成树状结构：根节点是整个图片，中间节点则是通过把图片分解成一系列 Region-leve