Mind‘s eye: A recurrent visual representation for image caption generation

Mind’s eye: A recurrent visual representation for image caption generation 头脑:用于图像标题生成的循环视觉表示 摘要:在本文中,我们探索图像之间的双向映射及其基于句子的描述。 对于我们的方法而言,至关重要的是一个递归神经网络,它会在生成或读取字幕时尝试动态构建场景的视觉表示。 代表会自动学会记住长期的视觉概念。 我们的模型
相关文章
相关标签/搜索