常见数据挖掘算法和Python简单实现

一、K近邻算法算法 原理:计算待分类样本与每一个训练样本的距离,取距离最小的K个样本,这k个样本,哪一个类别占大多数,则该样本属于这个类别。bootstrap 优势:一、无需训练和估计参数,二、适合多分类,三、适合样本容量比较大的问题网络 缺点:一、对测试样本内存开销大,二、可解释性差,没法生成规则,三、对样本量小的问题,容易误分dom 经验:K通常低于样本量的平方根,基于交叉验证机器学习 问题:
相关文章
相关标签/搜索