数据预处理(1)——数据清洗

一、介绍     数据清洗主要内容是删除原始数据集中的无关数据、重复数据,平滑噪声数据,刷选掉与挖掘主题无关的数据,处理缺失值、异常值等。 二、缺失值处理     缺失值处理的方法分为三类:删除记录、数据插补和不处理。常见的数据插补方法如下图: 其中,需要介绍的两个插值法为:拉格朗日插值法和牛顿插值法。 2.1 拉格朗日插值法 2.2 牛顿插值法 3、关于拉格朗日插值法的示例 #拉格朗日插值代码
相关文章
相关标签/搜索