数据预处理_数据清理(缺失值、噪声等详细处理)

1、概述 实际的数据库极易受噪声、缺失值和不一致数据的侵扰,因为数据库太大,并且多半来自多个异种数据源。低质量的数据将会导致低质量的挖掘结果。有大量的数据预处理技术: - - 数据清理:可以用来清楚数据中的噪声,纠正不一致。  - - 数据集成:将数据由多个数据源合并成一个一致的数据存储,如数据仓库。  - - 数据归约:可以通过如聚集、删除冗余特征或聚类来降低数据的规模。  - - 数据变换:(
相关文章
相关标签/搜索