数据预处理的步骤

数据清理–>数据集成 —>数据归约–>数据变换 1.数据清理 就是处理脏数据,包括填写缺失值、清除噪声数据(降噪)、纠正不一致数据、识别或删除离群点等。常用工具例如:ETL工具 2.数据集成(data integration) 集成多个数据库数据。将数据由多个数据源合并成一个一致数据存储,如:数据仓库。 【注意】不同数据库相同字段可能具有不同的名字,导致不一致和冗余,所以在为数仓做准备数据时,数据
相关文章
相关标签/搜索