编程之法之海量数据处理:寻找Top K的热词

题目: 有100万个关键字,长度小于50个字节。用有效的算法找出Top 10的热词,要求对内存的占用不超过1 MB。 分析: 这是大家面试中都被问道的问题,可以直接使用map-reducer直接解决这个问题。如果不能使用这个架构,我们手动实现,也是采用的这个思想,只是这个用文件代替节点。 1 0 6 ∗ 50 B = 50 ∗ 1 0 6 B = 50 M B 10^6 * 50B = 50 *
相关文章
相关标签/搜索