本系列笔记内容参考来源为李航《统计学习方法》学习
最大熵原理认为学习几率模型时,熵最大的模型是最好的模型。优化
设离散随机变量X的几率分布是P(X),则其熵是 spa
首先考虑模型应知足的条件,给定训练数据集,可肯定联合分布P(X,Y)的经验分布和边缘分布P(X)的经验分布blog
书中将约束最优化的原始问题转换为无约束最优化的对偶问题,经过求解对偶问题求解原始问题。学习方法