label smooth/mixup——深度学习中的一种防止过拟合方法

  Label Smooth 在常见的多分类问题中,先经过softmax处理后进行交叉熵计算,原理很简单可以将计算loss理解为,为了使得网络对测试集预测的概率分布和其真实分布接近,常用的做法是使用one-hot对真实标签进行编码,作者认为这种将标签强制one-hot的方式使网络过于自信会导致过拟合,因此软化这种编码方式。 等号左侧:是一种新的预测的分布 等号右侧:前半部分是对原分布乘一个权重, 
相关文章
相关标签/搜索