Spark如何解决常见的Top N问题

需求   假设我们有一张各个产品线URL的访问记录表,该表仅仅有两个字段:product、url,我们需要统计各个产品线下访问次数前10的URL是哪些?   http://www.cnblogs.com/yurunmiao/p/4898672.html 解决方案   (1)模拟访问记录数据     模拟数据记录共有1000条,其中包括10个产品线:product1、product2、…、produ
相关文章
相关标签/搜索