Deep Mutual Learning论文阅读笔记

摘要 模型蒸馏是将知识从教师模型传给学生模型有效且被广泛使用的技术,典型的应用就是将一个很大并且能力很强的网络中集成到一个比较小的网络中,因为小的网络更加满足低存储和高效率的要求。在本文中,我们提出一种深度相互学习策略,在训练的过程中学生网络和教师网络可以相互合作学习,而不是单方向的学生从教师那里学习。我们的实验表明各种网络架构都能够从相互学习策略中受益,并且在CIFAR-100和行人重识别数据集
相关文章
相关标签/搜索