[翻译]Beyond Short Snippets: Deep Networks for Video Classification

摘要 卷积神经网络(CNNs)被广泛应用于图像识别问题,在识别、检测、分割和检索方面提供了最先进的结果。在这项工作中,我们提出并评估了几个深度神经网络架构,将在一个视频中更长时间的图像信息结合起来。我们提出了两种处理全长度视频的方法。第一个方法探索了各种卷积时间特征池架构,研究了在为这个任务调整CNN时需要做出的各种设计选择。第二种方法明确地将视频建模为一个有序的帧序列。为此,我们使用了一个循环的
相关文章
相关标签/搜索