构建树ID3和C4.5(决策树基础知识二)

学习的简单笔记,只是对一些概念之类的进行简单记录 1. ID3算法 对于 对上图构建决策树 过度拟合: 如果决策树对训练样本的特征描述得“过于精确”,无法实现对新样本的合理分析,所以此时它不是一棵分析新数据的最佳决策树。一棵完全决策树能非常准确地反映训练集中数据的特征,但因失去了一般代表性而无法用于对新数据的分类或预测,这种现象一般称为“过拟合”。 定义: 给定一个假设H,如果在假设空间上存在另一
相关文章
相关标签/搜索