【数据挖掘笔记三】数据预处理

  3.数据预处理 数据预处理技术: 数据清理用来清除数据中的噪声,纠正不一致; 数据集成将数据由多个数据源合并成一个一致的数据存储,如数据仓库; 数据归约通过如聚集、删除冗余特征或聚类来降低数据的规模; 数据变换(如规范化)把数据压缩到较小的区间,如[0,1],可以提高涉及距离度量的挖掘算法的准确率和效率。 3.1数据预处理:概述 数据质量的三要素:准确性、完整性和一致性。然而,现实世界的大型数
相关文章
相关标签/搜索