数据挖掘 第三章 第四章 :数据预处理的主要任务+数据规范化的方法+数据仓库OLAP

一、数据预处理的主要任务: (1)数据清理:通过填写缺失的值、光滑噪声数据、识别和删除离群点等方法去除数据中的噪声数据和无关数据,并且处理遗漏的数据和清洗“脏”数据,考虑时间顺序和数据变化等。数据清理主要针对缺失值的数据处理,并完成数据类型的转换。 (2)数据集成:当需要分析挖掘的数据来自多个数据源时,就需要集成多个数据库、数据立方体或文件,即数据集成。 (3)数据归约:就是指对数据集进行简化表示
相关文章
相关标签/搜索