Spark分组取TopN

这篇文章主要介绍在Spark中如何分组取TopN元素的两种方法: 第一种方法基于Spark SQL的窗口函数实现, 第二种方法基于原生的RDD接口实现。 构造数据 首先咱们构造一份班级的成绩数据,这份数据有三列组成,第一列是考试科目category,第二列是学生的名字name,第三列是学生的成绩。以下:sql val df = spark.createDataFrame(Seq(   ("A",
相关文章
相关标签/搜索