数据挖掘---数据预处理

数据会收到噪声、缺失值和不一致数据的侵扰。数据预处理技术:数据清理可以清除数据中的噪声;数据集成可以将数据由多个数据源合并成一个一致的数据存储;数据变换可以将数据压缩到较小的区间如0-1;数据归纳可以通过如聚集、删除荣誉特征或聚类来降低数据的规模。 数据清理---缺失值 忽略元组:不能使用该元组的剩余属性值。除非元组有多个属性缺少值,不然该方法不是很有效 人工填写缺失值:当数据集很大,缺失值很多时
相关文章
相关标签/搜索