Knowledge Integration Networks for Action Recognition AAAI 2020

AAAI 2020 码隆科技实验室+南京大学 1 摘要 在这项工作中,我们提出了用于视频动作识别的知识集成网络(KINet)。KINet能够聚合有意义的上下文特征,这些特征对于识别动作非常重要,例如人类信息和场景上下文。我们设计了一个由一个动作识别主分支和两个辅助分支组成的三分支体系结构,该结构允许模型对动作识别中的人和场景知识进行编码。我们探索了两种预先训练的教师网络模型来提取人类和场景的知识,
相关文章
相关标签/搜索