使用Python构建决策树

一、信息增益python     划分数据集的大原则是:将无序的数据变得更加有序。在划分数据集先后信息发生的变化称为信息增益,得到信息增益最高的特征就是最好的选择。集合信息的度量方式称为香农熵或者简称为熵。数组     咱们采用Python计算信息熵,建立名为trees.py的文件,此代码的功能是计算给定数据集的熵(D)。 函数 from math import log def calcShann
相关文章
相关标签/搜索