Grounded video description

Introduction Grounded video description. CVPR, 2019. 这篇文章的主要贡献在于提出了新的密集事件描述ActivityNet Entities数据集,在Activity Captions的基础上,添加了captions中NP名词短语与视频中的物体的对齐。 由于源数据集中数据量过大,因此采用了稀疏标注的方法,对每个视频切割出segment,在每个seg
相关文章