【机器学习】好想彻底搞明白L1/L2正则

1.L1/L2的先验 2.为什么L1正则会使得参数稀疏,而L2不会? 3.如何求解Lasso?次梯度问题 4.从数学角度解释为什么L2正则可以提升模型的泛化能力? 1.L1/L2的先验 说到先验的概念就不得不提到贝叶斯理论的概念,由于现在大家都是提倡大数据的时代,而数据量越大,贝叶斯理论中先验的力量就会越小,但是实际上大多数模型中,尤其是今天我们说的正则化中都有着贝叶斯理论的影子。 但是贝叶斯理论
相关文章
相关标签/搜索