Neural Baby Talk学习笔记

Neural Baby Talk学习笔记 [1803.09845] Neural Baby Talk 1、介绍 深度学习时代 采用LSTM模型,过分依赖language model,导致caption经常与图像内容关联不够。 深度学习之前 更依赖图像内容,而对language model关注不多,例如采用一系列视觉检测器检测图像内容,然后基于模板或者其他方式生成caption 作者观点 减少对语言
相关文章
相关标签/搜索