Python机器学习 -- 数据预处理(理论)

1、为何数据须要进行预处理?        数据预处理是数据挖掘的重要一环,要使挖掘方案挖掘出丰富的知识,就必须为它提供干净、准确、简洁的数据。然而实际应用系统中收集到的原始数据是“脏”的,不彻底的、冗余的和模糊的,不多能直接知足数据挖掘算法的要求。在海量的实际数据中无心义的成分也不少,严重影响了数据挖掘算法的执行效率,其中的噪声干扰还会形成无效的概括。预处理已经成为数据挖掘系统实现过程当中的关键
相关文章
相关标签/搜索