大数据预处理技术

学习了牛琨老师的课程后整理的学习笔记,用于日后复习 一、大数据预处理的几个步骤 1.数据预处理 2.数据清洗 3.数据集成 4.数据归约 5.数据变换  6.数据离散化 7.大数据预处理 二、数据预处理 现实中的数据大多是“脏”数据: ①不完整 缺少属性值或仅仅包含聚集数据 ②含噪声 包含错误或存在偏离期望的离群值 比如:salary=“-10”,明显是错误数据 ③不一致 用于商品分类的部门编码存
相关文章
相关标签/搜索