k-近邻算法

1、有监督的算法,即需要依赖标签; 2、算法原理:、 (1)计算已知类别数据集中的点和当前点的距离; (2)按照距离依次排序; (3)选取与当前点距离最小的K个点; (4)确定前K个点所在类别的出现概率; (5)返回前K个点出现概率最高的类别作为当前点预测分类。 3、优点: 算法本身比较简单,不需要进行训练,训练复杂度为0 4、缺点: KNN分类算法的计算复杂度和训练集中的文档数目成正比,即,如果
相关文章
相关标签/搜索