机器学习之数据预处理

一. 数据预处理 1)导入主要的库,pandas数据处理库,Numpy数学运算库。 2)导入数据集,数据集的格式有很多,json,csv,txt,等 以csv为例,通过pandas读取。 3)数据集中会出现很多问题,例如缺失值,异常值,会影响模型的准确率,所以需要对这些值进行处理。这里会用到sklearn库,sklearn.preprocessing中的Imputer中完成。 4)处理标签值,如果
相关文章
相关标签/搜索