读《python数据挖掘与分析实战》之四

数据预处理 在数据挖掘中,海量的原始数据中存在着大量不完整,不一致,有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据清洗就显得尤为重要,数据清洗完成后接着进行或者同时进行数据集成,转换,规约等一系列的处理,该过程就是数据预处理。数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或者工具。 数据预处理的主要内容包括数据清洗,数据集成
相关文章
相关标签/搜索