spark常用小函数

1、keyBy 为rdd按指定key生成key-value形式 scala> val a = sc.parallelize(List("dog", "salmon", "salmon", "rat", "elephant"), 3) a: org.apache.spark.rdd.RDD[String] = ParallelCollectionRDD[123] at parallelize at
相关文章
相关标签/搜索