【数据挖掘笔记三】数据预处理

  3.数据预处理 数据预处理技术:算法 数据清理用来清除数据中的噪声,纠正不一致;数据库 数据集成将数据由多个数据源合并成一个一致的数据存储,如数据仓库;网络 数据归约经过如汇集、删除冗余特征或聚类来下降数据的规模;数据结构 数据变换(如规范化)把数据压缩到较小的区间,如[0,1],能够提升涉及距离度量的挖掘算法的准确率和效率。函数 3.1数据预处理:概述 数据质量的三要素:准确性、完整性和一致
相关文章
相关标签/搜索