异常检测的统计学方法

通常可以使用两种指标:Z分数 和 四分位距(IQR)。 计算一个样本的 z 分数,就是减去均值再除以标准差,如果绝对值大于三倍标准差,就认为这个样本异常,属于离群点。 对于正态分布的数据,用 Z 分数为指标,有千分之三的离群点。 用 IQR 为指标,判定的方式为:在四分位点上加上1.5倍IQR,这个范围之外的都是离群点,正态分布有千分之七的离群点。 IQR 常用来画箱线图,所以箱线图也可以用来直观
相关文章
相关标签/搜索