机器学习:对决策树剪枝

         昨天推送中介绍了决策树的基本思想,包括从众多特征中找出最佳的分裂点,刚开始你们都是用选择这个特征后带来的信息增益为基本方法,后来发现它存在一个严重的bug,所以提出来了信息增益率(即还要除以分裂出来的那些节点对应的自身熵的和),再后来,又提出来一个与熵概念相似的基尼系数,根据这些理论和训练数据能够构建出一颗大树了。可是这颗大树的泛化能力通常,须要进行剪枝操做才能提高泛化能力,那么
相关文章
相关标签/搜索