Visual Question Answering with Memory-Augmented Networks阅读心得

本文中利用记忆增强神经网络来预测视觉问题的准确答案,即使这些答案很少出现在训练集中。记忆网络结合了内部和外部记忆块,并有选择地关注每个训练范例。证明了在答案重尾分布的VQA环境中,记忆增强神经网络能够保持对稀缺训练样本的相对长期记忆。 一、文章引入 现有的VQA系统训练深度神经网络存在的两个问题: 1)首先,使用基于梯度的方法训练的深度模型学会响应大多数训练数据,而不是特定的稀缺样本。然而,在自然
相关文章
相关标签/搜索