Spark快速大数据分析系列之第四章键值对操做

动机 键值对形式的RDD提供了新的强大的操做接口 键值对形式的RDD具备一个重要特性:分区。一些状况下能够显著提高性能 建立Pair RDD 读取外部数据时:若是外部数据自己是键值对形式的,读取回来的RDD也是键值对形式 个普通的 RDD 转为 pair RDD 时,能够使用map()函数 val pairs = lines.map(x => (x.split(" ")(0), x)) //
相关文章
相关标签/搜索