RNN 在图像描述生成中扮演的角色?(翻译)

摘要 在图像描述生成系统中,递归神经网络(RNN)通常被视为主要的“生成”组件。这个观点表明图像特征应该被注入到RNN中。这实际上是文学中的主导观点。或者,RNN可以被视为仅对先前生成的词进行编码。这个观点表明,RNN只能用来编码语言特征,只有最后的表示与后期的图像特征“合并”。 本文比较了这两种体系结构。我们发现,一般来说,后期合并优于注入,这表明RNN更好地被视为编码器,而不是发生器。 引言
相关文章
相关标签/搜索