论文介绍--Memory-Attended Recurrent Network for Video Captioning

时间 2020-12-30

标签笔记人工智能深度学习基础理论与技术实践 VideoCaptioning encoder-decoder memory msvd msr-vtt 栏目系统网络繁體版

原文原文链接

Memory-Attended Recurrent Network for Video Captioning 这篇论文发表在2019年的CVPR上。作者Wenjie Pei等人来自腾讯和南方科技大学。研究动机目前做视频描述的主流框架是编码器-解码器（encoder-decoder）结构。这种架构潜在的劣势在于它无法捕捉存在于在当前视频之外的视频文本信息。作者为了解决生成描述时只显式地根据当前视

>>阅读原文<<