论文笔记:Show, Edit and Tell : A Framework for Editing Image Captions

背 景: 对现有字幕进行编辑更容易些,编辑字幕不需要关注现有信息,使它只需要专注于固定细节(例 如重复的单词)就可以。 创新点: 本文提出了一种基于现有字幕迭代自适应细化的图像字幕处理方法。 我们的模型由两个子模块组成: EditNet:具有自适应复制机制(Copy-LSTM)和选择性复制存储器注意机制(SCMA)的语言模块。一个编辑 现有图像标题的框架,由一个带有选择性复制存储器注意(SCMA)
相关文章
相关标签/搜索