Spark操做—aggregate、aggregateByKey详解

1. aggregate函数apache        将每一个分区里面的元素进行聚合,而后用combine函数将每一个分区的结果和初始值(zeroValue)进行combine操做。这个函数最终返回的类型不须要和RDD中元素类型一致。分布式         seqOp操做会聚合各分区中的元素,而后combOp操做把全部分区的聚合结果再次聚合,两个操做的初始值都是zeroValue.   seqO
相关文章
相关标签/搜索