数据预处理之异常值处理

定义: 异常值,即在数据集中存在不合理的值,又称离群点。好比年龄为-1,笔记本电脑重量为1吨等,都属于异常值的范围。从集合角度来看,异常值即离群点,以下图所示:python 判别方法: 1.简单统计分析 对属性值进行一个描述性的统计,从而查看哪些值是不合理的。好比对年龄这个属性进行规约:年龄的区间在[0:200],若是样本中的年龄值再也不该区间范围内,则表示该样本的年龄属性属于异常值。web 2.
相关文章
相关标签/搜索