西瓜书第四章总结

西瓜书第四章总结 1.树的划分流程 2. 树的划分选择 3.如何对抗过拟合 4.如何处理连续值与缺失值 CART分类树与回归树原理 参考 1.树的划分流程 2. 树的划分选择 树的划分选择也即如何选择最优划分属性 常用三种划分规则:信息增益、信息增益率、基尼指数 ID3:采用信息增益划分数据,计算获得所有特征中信息增益最大的特征,用于划分数据集。不过信息增益准则对可取值数目较多的属性有所偏好 C4
相关文章
相关标签/搜索