论文阅读 Deep Attentional Structured Representation Learning for Visual Recognition

Abstract 深度学习能够融合一些局部特征,但是在一定程度上忽略了很多的局部有判别力的特征,这个时候需要attention来帮忙,对于常见的结构表达BOW,VLAD也有了长足的发展,NetVLAD,和FisherNet,本文最后的优化采用了NetVLAD的优化方法,解耦了dictionary和descriptor之间的关系 所以本文就是NetVLAD+attention Architectur
相关文章
相关标签/搜索