Two-Stream Convolutional Networks for Action Recognition in Videos（summary part）

时间 2021-01-02

标签 DeepLearning Action Recognition 栏目 Apache 繁體版

原文原文链接

算法介绍双流网络使用以单帧RGB作为输入的CNN来处理空间维度的信息，使用以多帧密度光流场作为输入的CNN来处理时间维度的信息，并通过多任务训练的方法将两个行为分类的数据集联合起来(UCF101与HMDB)，去除过拟合进而获得更好效果。贡献提出two-stream ConvNet来对时空特征进行建模表示提出了多帧光流作为输入，对性能提升作用很大源码未公开源码光流图像中物体的运动可以

>>阅读原文<<