image caption笔记（九）：《Unsupervised Image Captioning》

时间 2020-12-20

原文原文链接

无监督的caption 文章使用一个图像数据集（MSCOCO）和一个文本语料库（从Web上抓取的200多万个句子组成图像描述语料库）来做无监督caption。没有任何配对集合。 1、模型结构：提出的图像字幕模型由图像编码器（没有用VGG 和resnet，改用了Inception v4），句子生成器和句子鉴别器组成。训练目标包括了三部分：（1）使用语料库来训练一个CGAN网络，cond