论文笔记--ActionVLAD: Learning spatio-temporal aggregation for action classification

时间 2021-01-02

原文原文链接

介绍这是去年CVPR2017的一篇动作分类的文章，用tensorflow实现，有预训练模型，代码链接如下： http://rohitgirdhar.github.io/ActionVLAD 这篇文章在时空上分别独立提取特征，然后做pooling聚合，采用了一种VLAD的pooling方法，端到端的训练，主要解决两个疑惑： 1.如何聚合视频帧之间的特征来表示整个视频。 2.在多流网络中(例如two

>>阅读原文<<