论文介绍--Memory-Attended Recurrent Network for Video Captioning

Memory-Attended Recurrent Network for Video Captioning 这篇论文发表在2019年的CVPR上。作者Wenjie Pei等人来自腾讯和南方科技大学。 研究动机 目前做视频描述的主流框架是编码器-解码器(encoder-decoder)结构。这种架构潜在的劣势在于它无法捕捉存在于在当前视频之外的视频文本信息。作者为了解决生成描述时只显式地根据当前视
相关文章
相关标签/搜索