PySpark算子处理空间数据全解析(16): reduceByKey算子简介(1)

前面的文章,讲了各种map,同学也都发现了,map后面老是跟着一个叫做reduceByKey的算子,是干嘛的呢?或者说,如何去理解它的运行原理呢? 正如名称所言:MapReduce算法,reduceByKey也是始祖级的算法。那么今天来说说这个reduceByKey算子的运行原理。 reduce从名字上看,就知道,主要是用来做聚合,比如下面的例子: 看看代码: reduceByKey,做核心的操作
相关文章
相关标签/搜索