【Python3实战Spark大数据分析及调度】第4章 Spark Core RDD编程

第4章 Spark Core RDD编程 常用的Transformation算子 sortByKey union distinct 结果就是partition中少了一个1,其他不变 join,需要K-V类型的RDD 普通的join就是inner join,得到两者都有的 leftOuterJoin 以左表为基准 rightOuterJoin 以右表为基准 fullOuterJoin 全部显示出来
相关文章
相关标签/搜索