读书笔记：Large-scale Vedio Classification with Convolutional Neural Networks

时间 2021-01-02

原文原文链接

主要点：一是设计了不同结构的CNN来学习视频分类。二是设计了一种加速训练的方法。不同结构的CNN 修改网络结构以加速训练不同结构的CNN Single Fusion ：和图片分类没有区别 Early Fusion : 在第一层的卷积中，就直接将输入帧全部融合，相当于将卷积扩展为三维。 Late Fusion ：每隔一定的帧数，抽取两帧，每帧的处理步骤与Single Fusion相同，但在全