数据清洗中异常值如何处理(下)

数据清洗工作中面对的对象有三个——异常值,缺失值和重复值。而每个肮脏数据都是有各自的清洗方法,尤其是异常值的方法是最多的。由此可见,数据中的异常值是有很多的,在上一篇文章中我们给大家介绍了关于清洗异常值的一些方法,在这篇文章中我们会继续为大家介绍异常值的清洗。 第一我们给大家介绍的是基于模型检测,具体操作就是先建立一个数据模型,异常是那些同模型不能完美拟合的对象;如果模型是簇的集合,则异常是不显著
相关文章
相关标签/搜索