L1 L2正则化及贝叶斯解释

1 L1正则化和L2正则化区别 L1得到的是稀疏权值,可以用于特征选择,假设参数服从Laplace分布(贝叶斯角度理解) L2得到的是平滑权值,因为所有权值都趋于最小,假设参数服从Gauss分布,(并趋于一致,因为一致时平方和,最小) 2 L1正则化稀疏解理解 2.1问题转化 2.2图形化解释   2.3其他理解 2.4 L1求导 求导方法:近端梯度下降   参考: [1]机器学习中的范数规则化之
相关文章
相关标签/搜索