论文笔记：Show, Edit and Tell : A Framework for Editing Image Captions

时间 2020-12-23

标签 PAPER 人工智能繁體版

原文原文链接

背景：对现有字幕进行编辑更容易些，编辑字幕不需要关注现有信息，使它只需要专注于固定细节（例如重复的单词）就可以。创新点：本文提出了一种基于现有字幕迭代自适应细化的图像字幕处理方法。我们的模型由两个子模块组成： EditNet：具有自适应复制机制(Copy-LSTM)和选择性复制存储器注意机制(SCMA)的语言模块。一个编辑现有图像标题的框架，由一个带有选择性复制存储器注意(SCMA)

>>阅读原文<<