机器学习十三大经典算法

一、决策树 根据一些 特征(feature )进行分类,每个节点提一个问题,通过判断,将数据分为两类,再继续提问。 判断的依据是信息熵增益,计算公式如下: 其中的n代表有n个分类类别(比如假设是2类问题,那么n=2)。分别计算这2类样本在总样本中出现的概率p1和p2,这样就可以计算出未选中属性分枝前的信息熵。 模型可以根据已有数据学习得到,再投入新数据的时候,就可以根据这棵树上的问题,将数据划分到
相关文章
相关标签/搜索