Neural Baby Talk

写下自己的理解。 1 Visual word,上图中的dog,cake就是visual word,也就是detector检测到的物体的词汇。   Text Word,“is on with”就是text word,也就是与视觉没有关系的词汇,“自己生成的吗?” 2 主要贡献——提出一个框架,能够生成(基于检测到的实体的)自然语言。 方法=slot+神经描述方法 3 我们的方法能够产生一些train
相关文章
相关标签/搜索