论文阅读 Deep TEN: Texture Encoding Network

1、Introduction 说实话和作者的context encoding那篇有点重了的感觉 作者将字典学习和编码融合到一个模型里面了 inherent的视觉字典是从损失中直接学习出来的 整个的表示是无序的,对于material和texture识别是特别有效的 最后的encoder层是传统的residual encoder(VLAD,FISHER)的一个全新的泛化,能够丢弃domain-spec
相关文章
相关标签/搜索