权重衰减(weight decay)与学习率衰减(learning rate decay)

“微信公众号” 1. 权重衰减(weight decay) L2正则化的目的就是为了让权重衰减到更小的值,在必定程度上减小模型过拟合的问题,因此权重衰减也叫L2正则化。 1.1 L2正则化与权重衰减系数 L2正则化就是在代价函数后面再加上一个正则化项: 其中C0表明原始的代价函数,后面那一项就是L2正则化项,它是这样来的:全部参数w的平方的和,除以训练集的样本大小n。λ就是正则项系数,权衡正则项与
相关文章
相关标签/搜索