机器学习-剪枝处理

决策树生成算法递归的产生决策树,直到不能继续分支或达到要求为止,这样的决策树往往对训练数据分类很准确,因为他就是基于训练数据的熵或者基尼不纯度(类似熵,计算更方便)进行分类的,因此对训练数据会产生过拟合现象,而对未知的数据则没有那么准确。过拟合的本质原因是决策树在训练时追求如何提高训练数据准确度,而没有考虑决策树的复杂性。 决策树由节点和有向边组成,节点有两种类型:内部节点和叶子节点,内部节点表示
相关文章
相关标签/搜索