若泽数据第三次SparkCore总结

1 Repartition和Colasce的区别 2 什么是Shuffle 3 RDD的特性之一是RDD之间存在一定的依赖,有几种依赖,它们分别是什么 4 GroupByKey和reduceByKey的区别:底层数据结构不一样,使用GroupByKey要谨慎; 5 Combiner预聚合 6 The following table summarizes terms you’ll see used
相关文章
相关标签/搜索