k近邻

在样本有限的情况,样本分布不规律且含有噪声的情况下,用最近邻来做决策难免有一定风险,因此对其引入打分机制,对未知样本的决策,不仅仅只依赖于最近的那一个已知样本,更可靠的做法是选择k个距离未知样本最近的已知样本,然后在这k个类别中进行打分来决定最后应该决策给谁。显然,最近邻就是1近邻。  另外,回顾下前面在讲概率密度函数的非参数估计时,是不是也提到了k近邻,没错,这篇文章就来认真的学习下k近邻。 2
相关文章
相关标签/搜索