数据挖掘:数据处理-异常值处理

1,什么是异常值?    异常值即是样本数据中的离群点,将那些明显与其他样本不同的数据视为异常值。异常值虽然数量较少,但是对于模型(对异常值敏感的模型)的影响很大,所以必须对异常值进行处理。 2,异常值的来源    异常值的来源主要分为人为误差和自然误差,具体来说包括以下几类:数据输入错误、测量误差、实验误差、故意异常值、数据处理错误、抽样错误、自然异常值。总而言之,在数据处理的任何环节都有可能产
相关文章
相关标签/搜索