权重衰减（weight decay）与学习率衰减（learning rate decay）

时间 2020-07-18

标签权重衰减 weight decay 学习 learning rate 繁體版

原文原文链接

“微信公众号” 1. 权重衰减（weight decay） L2正则化的目的就是为了让权重衰减到更小的值，在必定程度上减小模型过拟合的问题，因此权重衰减也叫L2正则化。 1.1 L2正则化与权重衰减系数 L2正则化就是在代价函数后面再加上一个正则化项：其中C0表明原始的代价函数，后面那一项就是L2正则化项，它是这样来的：全部参数w的平方的和，除以训练集的样本大小n。λ就是正则项系数，权衡正则项与

>>阅读原文<<