2011Alibaba数据分析师(实习)试题解析

1、异常值是指什么?请列举1种识别连续型变量异常值的方法?算法 异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其他观测值。在数理统计里通常是指一组观测值中与平均值的误差超过两倍标准差的测定值。 Grubbs’ test(是以Frank E. Grubbs命名的),又叫maximum normed residual test,是一种用于单变量数据集异常值识别的统计检测,它假定
相关文章
相关标签/搜索