python用箱型图进行异常值检测

异常值检测:数据挖掘工做中的第一步就是异常值检测,异常值的存在会影响实验结果。异常值是指样本中的个别值,也称为离群点,其数值明显偏离其他的观测值。经常使用检测方法3 σ 原则和箱型图。其中,3 σ 原则只适用服从正态分布的数据。在3 σ 原则下,异常值被定义为观察值和平均值的误差超过3倍标准差的值。 P(|x−μ|>3σ)≤0.003 ,在正太分布假设下,大于3 σ 的值出现的几率小于0.003,
相关文章
相关标签/搜索