《机器学习》(周志华)笔记之降维(一)

西瓜书第十章降维,以kNN开篇,旨在寻找样本点的“近邻”,但当维度过高且样本稀疏时,一种自然地解决思路就是“降维”。人们观测到的数据样本虽是高维的,但与学习任务紧密相关的也许仅是一个低维分布,即高维空间中的一个低维嵌入。 kNN:     1、不同的k      2、不同的距离计算方式       会导致分类结果有显著地不同 但其泛化错误率不超过贝叶斯最优分类器的错误率的两倍。简单的模型也许会有更
相关文章
相关标签/搜索