读书笔记:Large-scale Vedio Classification with Convolutional Neural Networks

主要点:一是设计了不同结构的CNN来学习视频分类。二是设计了一种加速训练的方法。 不同结构的CNN 修改网络结构以加速训练 不同结构的CNN Single Fusion : 和图片分类没有区别 Early Fusion : 在第一层的卷积中,就直接将输入帧全部融合,相当于将卷积扩展为三维。 Late Fusion : 每隔一定的帧数,抽取两帧,每帧的处理步骤与Single Fusion相同,但在全
相关文章
相关标签/搜索