常用PySpark API(一): parallelize, collect, map, reduce等API的简单用法

参考: 1. http://www.javashuo.com/article/p-dpuhqnfm-bw.html 2. https://blog.csdn.net/wc781708249/article/details/78228117 0. RDD数据类型 RDD(Resilient Distributed DataSet)是一种弹性分布式数据集,是Spark的核心,其可以有由稳定存储中的数据
相关文章
相关标签/搜索