数据预处理_数据清理

一、概述前端 实际的数据库极易受噪声、缺失值和不一致数据的侵扰,由于数据库太大,而且多半来自多个异种数据源。低质量的数据将会致使低质量的挖掘结果。有大量的数据预处理技术: - - 数据清理:能够用来清楚数据中的噪声,纠正不一致。 - - 数据集成:将数据由多个数据源合并成一个一致的数据存储,如数据仓库。 - - 数据归约:能够经过如汇集、删除冗余特征或聚类来下降数据的规模。 - - 数据变换:(例
相关文章
相关标签/搜索