机器学习之数据预处理

一. 导入需要的库 例如,科学计算的NumPy、数据处理的Pandas。画图的包matplotlib。 二. 导入数据集 使用pandas.read_csv读取csv文件。使用其他的方法读取不同类型的文档。 三. 处理数据的缺失值 我们可以使用缺失数据那一列的均值,或者是中位数、众数来进行替换,如何数据量大的情况下,也可以视情况来进行缺失数据的删除。 四. 特征归一化 样本的不同的特征之间的值可能
相关文章
相关标签/搜索