Spark Core 和 Spark SQL 实现分组取Top N(基于scala)

分组取Top N在平常需求中不少见:sql 每一个班级分数前三名同窗的名字以及分数 各省指标数量前三的市的名字  等等需求,主要思想就是在某一个分区(班级,省)中取出该分区Top N的数据数组 测试数据格式:函数 如上图,字段含义为,班级,学生姓名,分数测试 下面咱们经过一个Demo来实现各班级分数前三的学生姓名以及分数spa 一、经过Spark core 实现:ssr //读取测试数据保存为rd
相关文章
相关标签/搜索