深度学习 | 训练网络trick——label smoothing(附代码)

1.背景介绍: 在多分类训练任务中,输入图片通过神级网络的计算,会获得当前输入图片对应于各个类别的置信度分数,这些分数会被softmax进行归一化处理,最终获得当前输入图片属于每一个类别的几率。c++ 以后在使用交叉熵函数来计算损失值:git 最终在训练网络时,最小化预测几率和标签真实几率的交叉熵,从而获得最优的预测几率分布。在此过程当中,为了达到最好的拟合效果,最优的预测几率分布为:github
相关文章
相关标签/搜索