使用最小堆解决海量数据数据中求TopK最大的几个数问题

时间 2019-12-04

原文原文链接

前几天面试遇到了这么一个问题:web 求一亿个数据中最大的100个数. 这个问题一脸懵逼我. 后来查了资料说使用HASH函数以及分治的思想来解决.将这1亿个数根据HASH去重而后根据hash值分别存储到1000个分区内,而后每一个分区都使用一个容量为100的最小堆获得每一个区最大的100个数. 最后将1000个分区内获得的最小堆再合并处理便可.面试这里主要是最小堆的问题. 怪我基础差,面试事后又

>>阅读原文<<