[数据分析学习笔记] 数据预处理

数据分析学习笔记 —— 数据预处理 数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。 数据预处理的主要内容包括:数据清洗、数据集成、数据变换和数据规约。 知识点总结如下图所示: 数据预处理的主要过程  数据清洗:主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值等。 数据集成:将多个数据源合并存放在一个一致
相关文章
相关标签/搜索