物联网数据分析与挖掘

数据预处理与知识发现 为什么要进行数据预处理? 因为在现实生活中存在着大量的“脏”数据 数据不完整的性 数据有噪音数据 数据不一致性 技术主要四种:数据清理,数据集成,数据变换,数据归约 数据清洗: 主要删去数据中的重复数据,消除数据中的噪音数据,纠正不完整和不一致的数据 噪声数据是指数据中存在着错误或异常(偏离期望值)的数据; 不完整数据是指数据中缺乏某些属性值: 不一致数据则是指数据内涵出现不
相关文章
相关标签/搜索