Spark SQL中的聚合(Aggregate)实现

Spark SQL中的聚合(Aggregate)实现 Sort Based Aggregate 首先来讲说实现比较简单(但实际执行起来却不简单)的Sort Based Aggregate。顾名思义,这是一种基于排序的聚合实现,在进行聚合以前,会根据grouping key进行分区以及分区内排序,将具备相同grouping key的记录都分布在同一个partition内且先后相邻,聚合时只须要顺序遍
相关文章
相关标签/搜索