第四章 决策树

1、基本流程 西瓜问题的决策过程: 根结点包含样本全集。 叶结点对应决策结果。(类别标记为样例中最多的类别) 其他结点对应属性测试,每个结点包含的样本集合根据属性测试的结果被划分到不同的子结点。 2、划分选择 即如何选择最优划分属性,使得决策树的分支结点所包含的样本尽可能属于同一类别。 (1)信息增益 信息熵(information entropy):度量样本集合纯度的指标。 假设样本集合D中第k
相关文章
相关标签/搜索