机器学习--详解CART树剪枝原理和过程

       这一节主要讲前面屡次的提到的决策树问题,前面的决策树生成算法递归的产生决策树,直到不能继续分支或者达到要求为止,这样的决策树每每对训练数据的分类很准确,由于他就是基于训练数据的熵或者基尼不存度进行分类的,所以对训练数据的会产生过拟合现象,而对未知的数据则没有那么准确。过拟合的本质缘由是决策树在训练时追求如何提升训练数据的准确度,而没有考虑构件出的决策树的复杂性,直观上咱们能想象出当决
相关文章
相关标签/搜索