第3章 键值对RDD数据分区器

上篇:第 2 章大数据SparkCore的RDD编程案例(下)javascript 1、键值对RDD数据分区器 Spark目前支持Hash分区和Range分区,用户也能够自定义分区,Hash分区为当前的默认分区,Spark中分区器直接决定了RDD中分区的个数、RDD中每条数据通过Shuffle过程属于哪一个分区和Reduce的个数java 注意: (1)只有Key-Value类型的RDD才有分区器
相关文章
相关标签/搜索