ACL20|MART: Memory-Augmented Recurrent Transformer for Coherent Video Paragraph Captioning

文章目录 背景 Motivation Related Work Approach Data Metrics implementation details 背景 腾讯AI Lab主导,与美国北卡罗来纳大学教堂山分校(UNC)合作完成。提出了一种增强视频描述生成的连贯性的循环Transformer结构MART,使用记忆存储单元增强transformer架构,实现递归模型。这个记忆存储单元从视频片段和句
相关文章
相关标签/搜索