图解Spark Transformation算子

0. 写在前面 Spark总共有两类算子,分别是Transformation算子和Action算子。Transformation算子变换不触发提交做业,而Action算子会触发SparkContext提交Job做业,下面主要使用pySpark API来做为事例,图解Spark的Transformation算子。python 1. join # join x = sc.parallelize([('
相关文章
相关标签/搜索