论文笔记--ActionVLAD: Learning spatio-temporal aggregation for action classification

介绍 这是去年CVPR2017的一篇动作分类的文章,用tensorflow实现,有预训练模型,代码链接如下: http://rohitgirdhar.github.io/ActionVLAD 这篇文章在时空上分别独立提取特征,然后做pooling聚合,采用了一种VLAD的pooling方法,端到端的训练,主要解决两个疑惑: 1.如何聚合视频帧之间的特征来表示整个视频。 2.在多流网络中(例如two
相关文章
相关标签/搜索