pyspark经常使用的基本操做

一.经过外部数据建立RDD # 1.经过本地数据建立RDD # 准备本地文件 cat myspark.txt >hello my name is Cocktail_py >welcome to my blogs # pyspark shell rdd = sc.textFile("file:////root/myspark.txt") rdd.collect() >['hello my nam
相关文章
相关标签/搜索