数据分析之数据预处理

数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。web 数据清洗 数据清洗主要是删除原始数据集的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值等.算法 缺失值处理 处理缺失值的方法可分为3类:dom 删除记录 数据插补 不处理 若是存在大量缺失的列,能够采用删除含有缺失值的记录的方法 其中经常使用的数据插补方法: 均值/中位数/众数插补:根据属性值
相关文章
相关标签/搜索