image caption笔记(九):《Unsupervised Image Captioning》

无监督的caption 文章使用一个图像数据集(MSCOCO)和一个文本语料库(从Web上抓取的200多万个句子组成图像描述语料库)  来做无监督caption。没有任何配对集合。   1、模型结构: 提出的图像字幕模型由图像编码器(没有用VGG 和resnet,改用了Inception v4),句子生成器和句子鉴别器组成。 训练目标包括了三部分: (1)使用语料库来训练一个CGAN网络,cond
相关文章
相关标签/搜索