Top K问题-海量元素取最大的前k个元素

在大规模数据处理中,经常会遇到的一类问题:在海量数据中找出出现频率最高的前k个数,或者从海量数据中找出最大的前k个数,这类问题通常被称为top K问题。例如,在搜索引擎中,统计搜索最热门的10个查询词;在歌曲库中统计下载最高的前10首歌等。 eg:有1亿个浮点数,如果找出期中最大的10000个? 该题目解法有很多,以下逐个阐述    最容易想到的方法是将数据全部排序,然后在排序后的集合中进行查找,
相关文章
相关标签/搜索