FTRL

时间 2021-01-21

原文原文链接

一、算法原理二、算法逻辑三、个人理解从loss function的形式来看：FTRL就是将RDA-L1的“梯度累加”思想应用在FOBOS-L1上，并施加一个L2正则项。【PS：paper上是没有加L2正则项的】这样达到的效果是：累积加和限定了新的迭代结果W**不要离“已迭代过的解”太远**；因为调整后的解不会离迭代过的解太远，所以保证了每次找到让之前所有损失函数之和最小的参数；保留的