Two-Stream Convolutional Networks for Action Recognition in Videos(summary part)

算法介绍 双流网络使用以单帧RGB作为输入的CNN来处理空间维度的信息,使用以多帧密度光流场作为输入的CNN来处理时间维度的信息,并通过多任务训练的方法将两个行为分类的数据集联合起来(UCF101与HMDB),去除过拟合进而获得更好效果。 贡献 提出two-stream ConvNet来对时空特征进行建模表示 提出了多帧光流作为输入,对性能提升作用很大 源码 未公开源码 光流 图像中物体的运动可以
相关文章
相关标签/搜索