数据挖掘 之 数据预处理

在数据挖掘中,原始数据存在大量不完整、有异常的数据,严重影响建模的执行效率,甚至会导致结果偏差,因此非常有必要进行数据清洗,数据清洗完成后接着或同时进行数据集成、转换、规约等一系列处理,这个过程就是数据预处理。 总而言之,数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。 一、数据清洗 数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理
相关文章
相关标签/搜索