决策树、随机森林与k-means聚类算法

决策树的构建知足信息熵增益最大化原则 决策树的优势:html 可解释性高 能处理非线性的数据 不须要数据归一化 能够用于特征工程 对数据分布没有偏好 普遍使用 容易软件实现 能够转化为规则 决策树的弱点算法 启发式生成,不是最优解 容易过拟合 微小的数据改变会改变整个树的形状 对类别不平衡的数据不友好 随机森林指训练多个决策树结果,预测时回归取均值,分类取众数 随机体如今带放回的随机取数据子集作训
相关文章
相关标签/搜索