数据预处理——缺失值和异常值的识别和填补

1、什么是异常值?什么是缺失值html 异常值(outlier):异常值是指数据集中存在不合理的值,又称离群点。一组测定值中与平均值的误差超过两倍标准差的测定值,与平均值的误差超过三倍标准差的测定值,称为高度异常的异常值。【百度百科】python 缺失值(missing value):是指粗糙数据中因为缺乏信息而形成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不彻底的。
相关文章
相关标签/搜索