3、K近邻法

(1)思想 假定给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测。三个基本要素是:k值的选择、距离度量和分类决策规则。 (2)k值的选择 在模型中,k值较小容易造成模型复杂,发生过拟合,而较大意味着欠拟合,通常采用交叉验证法来选取最优的k值。在分类决策时,采用多数表决规则,等价于经验风险最小化。 (3)构造kd树 kd树是一种
相关文章
相关标签/搜索