经常使用SparkRDD容易混淆的算子区别(Scala版本)

经常使用SparkRDD容易混淆的算子区别 1.map与flatMap的区别 # 初始化数据 val rdd1 = sc.parallelize(Array("hello world","i love you")) map # map算子 rdd1.map(_.split(" ")).collect # map算子结果输出 res0: Array[Array[String]] = Array(A
相关文章
相关标签/搜索