集成学习算法之boosting、bagging和随机森林算法原理

集成学习的定义 集成学习的主要思路是先经过必定的规则生成多个学习器,再采用某种集成策略进行组合,最后综合判断输出最终结果。通常而言,一般所说的集成学习中的多个学习器都是同质的"弱学习器"。基于该弱学习器,经过样本集扰动、输入特征扰动、输出表示扰动、算法参数扰动等方式生成多个学习器,进行集成后得到一个精度较好的"强学习器"。算法 举例说明:以三分类问题为例,假若有 N 个分类器相互独立,错误率都为
相关文章
相关标签/搜索