学习笔记(二)数据挖掘概念与技术

1中心趋势度量:均值(mean)、中位数、众数 截尾均值:丢掉高低极端值后的均值 加权算术均值(加权平均): 中位数(median)是有序数据的中间值,对于非对称数据是数据中心更好的度量。 用插值法计算中位数的近似值:median=其中是中位数区间的下界,N是整个数据集中值的个数,是低于中位数区间的所有区间的频率和,是中位数区间的频率,而width是中位数区间的宽度。 众数(mode):集合中出现
相关文章
相关标签/搜索