大数据算法基础笔记

一、分类算法:对数据分类和预测 1. KNN算法即K近邻(K Nearest Neighbour)算法,是一种基本的分类算法,其主要原理是:对于一个需要分类的数据,将其和一组已经分类标注好的样本集合进行比较,得到距离最近的K个样本,K个样本最多归属的类别,就是这个需要分类数据的类别。下面是KNN算法的原理图: 上图中,红蓝绿三种颜色的点为样本数据,分属三种类别ω1​、ω2​和ω3。对于待分类点Xu
相关文章
相关标签/搜索