林子雨-Spark入门教程(Python版)-学习笔记(二)

第3章 Spark编程基础 从文件加载数据 从文件系统中加载数据创建RDD——textFile()方法,该方法把文件的URI作为参数 注意: (1)本地文件系统的路径,必须要保证在所有的worker节点上都有该文件。 (2)textFile()方法的输入参数,可以是文件名,也可以是目录,也可以是压缩文件等。比如,textFile(“/my/directory”), textFile(“/my/di
相关文章
相关标签/搜索