机器学习之十大经典算法(一)KNN算法

     分类思想比较简单,从训练样本中找出 K 个与其最相近的样本,然后看这 k 个样本中哪个类别的样本多,则待判定的值(或说抽样)就属于这个类别。     缺点:        1)K 值需要预先设定,而不能自适应,一般选择20,如果数据量小的话,可以调参。       2)当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的 K 个邻居中大容
相关文章
相关标签/搜索