论文解析:Motion Guided Spatial Attention for Video Captioning

简介     这篇论文是复旦大学姜育刚教授团队发表在2019 AAAI上的一篇论文,这篇论文的主要思想是通过光流图“引导”空间上的注意力,从而实现视频字幕生成的任务。我个人认为这篇论文的思想较为新颖,合理,因此详细的阅读了这篇文章并再此做一个记录。 1.论文思想     这篇论文中提到一个人类视觉注意力的一个“习惯”:人类的注意力更容易被视频中明显变化的区域所吸引。基于这个观点,这篇文章提出一种非
相关文章
相关标签/搜索