【视频行为识别】ECO:Efficient Convolutional Network for Online Video Understanding

提出问题: 1. 大部分推理均是局部(如取2s一段的子片段)进行的,丧失了跨越数秒的动作内的重要关系。 2. 尽管有快速桢处理的局部方法,整个视频的处理效率不高,有损在线长视频分类检索的效率。 本文:引入一种网络结构(考虑进了长视频和短视频,同时能使快速实现每个视频(per-video)的处理),该结构基于融合网络中的长时间内容,而不是像之前论文中先将视频分n个片段,然后网络分别处理每个片段,最后
相关文章
相关标签/搜索