异常值的处理

原理3西格玛准则,对一组数据计算处理后,可以得到一个置信区间,在此区间之外的部分应该被视为异常值。 3西格玛:0.68-0.95-0.99。 处理方法:箱线图 上下两边出现的点视为异常值.Pandas中提供boxplot()方法绘制箱型图 a)直接删除 b) 使用前后两个边界值的均值替换 c) 不处理 d) 视为缺失值,利用缺失值的处理方法修正 若要对异常值进行修改,使用 pandas.DataF
相关文章
相关标签/搜索