小白数据挖掘进阶之路2----(房租预测)数据清洗

上一节中我们已经大概了解了数据的分布,这里我们考虑如何对数据进一步处理**(数据清洗)**(比较难,需要花较多的时间去处理数据) 1.缺失值分析及处理 缺失值出现的原因分析,采取合适的方式对缺失值进行填充 2.异常值分析及处理 根据测试集数据的分布处理训练集的数据分布,使用合适的方法找出异常值,对异常值进行处理 我们几个模块来进行分析: 1.加载一些必要的包,其中的一些包之前没有接触过,就自己查了
相关文章
相关标签/搜索