Pair RDD基本操做

Pair RDD基本操做 虽然大部分Spark的RDD操做都支持全部种类的对象,可是有少部分特殊的操做只能做用于键值对类型的RDD。这类操做中最多见的就是分布的shuffle操做,好比将元素经过键来分组或汇集计算。在Python中,这类操做通常都会使用Python内建的元组类型,好比(1, 2)。生成的键值对的RDD称为PairRDD。web 建立Pair RDD 有不少种建立键值对的方式,不少存
相关文章
相关标签/搜索