论文笔记:Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning

论文链接:Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning Introduction 目前大多数的基于attention机制的image captioning模型采用的都是encoder-decoder的框架。然而在decode的时候,decoder应该对不同的词有不同的atten
相关文章
相关标签/搜索