更新、更全的《机器学习》的更新网站,更有python、go、数据结构与算法、爬虫、人工智能教学等着你:http://www.javashuo.com/article/p-vozphyqp-cm.htmlpython
假设Nick的年龄是25岁。算法
把Nick的年龄设置成初始值0岁去学习,若是第1棵决策树预测Nick的年龄是12岁,即残差值为\(25-12=13\)数据结构
把Nick的年龄设置成残差值3岁去学习……机器学习
加法模型(additive model)通常表示为弱学习器加和
\[ f(x) = \sum_{t=1}^T\theta_tb(x;\gamma_t) \]
其中\(b(x;\gamma_t)\)为弱学习器,\(\gamma_t\)为弱学习器的参数,\(\theta_t\)为弱学习器的系数。函数
给定训练数据以及目标函数\(L(y,f(x))\),加法模型的经验风险最小化问题既能够变为目标函数最小化问题
\[ \underbrace{min}_{\theta_t,\gamma_t}\sum_{i=1}^mL(y_i,\sum_{t=1}^T\theta_tb(x_i;\gamma_t)) \]
上述加法模型的目标函数优化问题是一个很复杂的优化问题,可是经过前向分布算法(forward stagewise algorithm)能够解决这一问题,它的思想是:由于学习问题是加法模型,因此每一步只学习一个弱学习器及其系数,而后逐步逼近优化目标函数,也就是说,每一步只须要优化以下所示的目标函数
\[ \underbrace{min}_{\theta,\gamma}\sum_{i=1}^mL(y_i,\theta{b(x_i;\gamma)}) \]学习
有\(m\)个数据\(n\)个特征的训练数据集\(T=\{(x_1,y_1),(x_2,y_2),\cdots,(x_m,y_m)\}\);目标函数\(L(y,f(x))\);弱学习模型集\(\{b(x;\gamma_t)\},\quad(t=1,2,\cdots,T)\),在Boosting算法中\(T\)至关于弱学习器的个数。优化
加法模型\(f(x)\)。网站