pyspark中RDD基本操做

写在前面 系统为ubuntu, spark为pysparkpython 一. 简单配置和读取txt,并打印 这里咱们定义一个任务:ubuntu 从txt中读取文件,并打印文件的每一行app from pyspark import SparkConf, SparkContext import os # 这里配置spark对用的python版本,若是版本不一致就会报错 os.environ["PYSP
相关文章
相关标签/搜索