数据分析之数据预处理

数据预处理步骤及方法 一、缺失值处理 1.一、形成缺失值缘由 缺失值处理原则: 使用最可能的值代替缺失值,使缺失值与其余数值之间的关系保持最大。 缺失值处理的方法不少,好比删除记录、均值填充、中位数填充等,具体方法如表1所示。 二、异常值处理 异常值是数据集中偏离大部分数据的数据。从数据值上表现为:数据集中与平均值的误差 超过两倍标准差 的数据,其中与平均值的误差超过三倍标准差的数据,称为高度异常
相关文章
相关标签/搜索