决策树1

树以代表训练样本的单个结点开始(步骤1)。 如果样本都在同一个类,则该结点成为树叶,并用该类标号(步骤2 和3)。 否则,算法使用称为信息增益的基于熵的度量作为启发信息,选择能够最好地将样本分类的属性(步骤6)。该属性成为该结点的“测试”或“判定”属性(步骤7)。在算法的该版本中, 所有的属性都是分类的,即离散值。连续属性必须离散化。 对测试属性的每个已知的值,创建一个分枝,并据此划分样本(步骤8
相关文章
相关标签/搜索