【机器学习】摘记-1

1:机器学习的大框架 2:决策树熵的计算和信息增益 决策树核心:每回合都是最大信息增益,直到S为0。 其他指标衡量分割好坏:基尼不确定性,错分率。 决策树分类常见问题及评价指标 数据属性问题 常见离散属性: 二元属性,标称属性,适合决策树分类算法。 数值型等连续型属性: 如年龄,身高,血压,在进行分类时采用连续属性离散化,即分段分区间的形式,才能很好的适应决策树算法。 过拟合问题 两种误差定义 训
相关文章
相关标签/搜索