ID3决策树中连续值的处理+周志华《機器學習》图4.8和图4.10绘制

转载自 http://www.javashuo.com/article/p-kgvlevwd-no.html 用一句话总结这篇博客的内容就是: 对于当前n条数据,相邻求平均值,得到n-1个分割值,要点如下: ①连续数值特征的熵计算就是对上面的n-1个分割值不停尝试, 尝试得到最佳分割值,利用分割值两侧的数据来计算条件熵 进而最终计算最大熵增益. ②如果当前同时存在离散值和连续值特征,那么连续值取最
相关文章
相关标签/搜索