学习笔记(三)数据预处理之数据清理

数据预处理算法 1概述。为了提升数据的质量,数据质量涉及准确性、完整性、一致性、时效性、可信性(反应多少数据是用户信赖的)和可解释性(反映数据是否容易理解)。数据预处理的主要步骤:数据清理、数据集成、数据归约和数据变换。数据库 数据清理:例程经过填写缺失的值,光滑噪声数据、识别或删除离群点,并解决不一致性来“清理”数据。数据集成:集成多个数据库、数据立方体或文件。数据归约:获得数据的简化表示,它小
相关文章
相关标签/搜索