论文阅读:Learnable pooling with Context Gating for video classification

这篇论文是2016年Google Cloud & YouTube-8M Video Understanding Challenge比赛中冠军得主的论文。 文章的两点贡献: 融合了VLAD, bag-of-visual-words和Fisher Vector三种编码方式,并且每个都做了一定程度的调整。其中,VLAD改为NetRVLAD, bag-of-visual-words改为Soft-DBoW,
相关文章
相关标签/搜索