数据分析之异常值分析

异常值分析又分连续异常值,离散异常值,和知识异常值。 一.连续异常值      Q3,Q2,Q1分别为上四分位数,中位数和下四分位数 如图上下界之间的为正常值,那么上下界以外的就是异常值了,由此可见,异常值的测定程度由K决定。 通常当K=1.5,就算是中等异常;K=3时,就算是非常的异常。 由于异常值的出现,它让大部分本可以代表数据属性的值失去意义 二.离散异常值  离散属性定义范围以外的所有值均
相关文章
相关标签/搜索