Scikit-learn 之 预处理模块

一、预处理的作用 在机器学习任务中,学习器都会对数据有一定的要求,比如在最近邻算法中,我需要寻找与中心点最近邻的点,假设我们使用欧式距离度量,如果有一个属性值是千万量级,而另一个属性是100以内,那么如此计算的距离会严重依赖于大量级的属性,这对最后模型结果是有很大的影响的。总之,预处理的目的就是为了能够让学习器得到“干净”的数据。 二、Sklearn有哪些预处理方案 2.1. 标准化 2.1.1.
相关文章
相关标签/搜索