Spark常用算子总结

Spark的算子的分类    从大方向来说,Spark 算子大致可以分为以下两类:      1)Transformation 变换/转换算子:这种变换并不触发提交作业,完成作业中间过程处理。      Transformation 操作是延迟计算的,也就是说从一个RDD 转换生成另一个 RDD 的转换操作不是马上执行,需要等到有 Action 操作的时候才会真正触发运算。      2)Acti
相关文章
相关标签/搜索