数据挖掘导论 笔记3

给定一个无序的、分类的值的集合,为了进一步刻画值的性质,除计算特定数据集中每个值出现的频率外没有多少的事情可做。给定一个在{1, … Vi, … Vk}.上取值的分类属性x和m个对象的集合,值vi的频率定义为: 分类属性的众数(mode) 是具有最高频率的值。 百分位数 对于有序数据,考虑值集的百分位数(percentile) 更有意义。具体地说,给定-一个有序的或连续的属性x和0与100之间的数
相关文章
相关标签/搜索