数据预处理之缺失值、异常值处理

缺失值的检查与处理应该来说是比较简单的,这篇先来说说异常值的检查与处理 一、异常值的检查 异常值的检查,最初我都是作图观察,把那些明显偏离了整体分布情况的点划归为异常点,这样的做法也带有比较强的主观性。 这边补充一些用来判断异常值的统计学方法。 1、基于正态分布的一元离群点检测方法 假设有 n 个点 ,那么可以计算出这 n 个点的均值  和方差。均值和方差分别被定义为:              
相关文章
相关标签/搜索