Java最小堆解决TopK问题

时间 2021-01-20

原文原文链接

2019独角兽企业重金招聘Python工程师标准>>> www.toutiao.im 其实我们与大数据并不遥远，比如要从海量数据中按大小或频率挑出top k，假定机器是多核的内存有限的，我们采用多线程分块处理数据，最后合并处理。那么，处理每一块数据的top k(i)可以采用哪些算法呢？ TopK问题是指从大量数据（源数据）中获取最大（或最小）的K个数据。 TopK问题是个很常见的问题：例如学校

>>阅读原文<<