机器学习实战(3、决策树:计算熵值、划分数据集、得到熵值最小的特征值)

K - 近邻算法能够完成不少分类任务算法 可是它最大的缺点就是没法给出数据的内在含义app 决策树的主要优点就在于数据形式很是容易理解 函数      一、熵:度量数据集的无序程度测试   计算数据集的香农熵:code # coding=utf-8 from math import log #计算数据集的香农熵 def calcShannonEnt(dataSet): #得到数据集的个
相关文章
相关标签/搜索