大数据处理之哈希表(二)--出现频率最多的top xxx 位

上篇文章中只是求了出现频次最高的值,可是大数据处理往往需求的是top 10 ,top 100或者某一段区间的数据。 显然只定义一个Hash a是不能放下的。如果是求出现频次top100呢?最起码定义 Hash arr[100]吧。 比如拿计数器10000长度和数据范围为32767来说。 我们最少要分4次,分别是数据取余4后  0  1  2 3的四种情况 第一次余数为0,即4的倍数这一组,我们是不
相关文章
相关标签/搜索