机器学习实战——使用k近邻算法改进约会网站的配对效果

整个示例总的来说没什么难度,就是先将文本文件进行解析,将文本文件中的数据分割成数据集和标签集 函数如下: 将文本文件解析完成后,我们需要考虑一个问题,就是如果就直接拿这个数据集去训练,由于各个属性的值不一致,数量级差别比较大,而我们又是根据距离的大小来判断类别的 这样自然造成数量级比较大的属性的在最后的结果中影响较大,这不是我们所希望的结果,故我们需要将整个训练集进行归一化之后,再进行训练。归一化
相关文章
相关标签/搜索