PySpark学习

一、RDD建立:数组 (1)从文件系统中加载数据建立RDD缓存 lines = sc.textFile("file:///usr/local/spark/mycode/rdd/word.txt")函数 (2)从HDFS中读取并加载数据oop >>> lines = sc.textFile("hdfs://localhost:9000/user/hadoop/word.txt")spa >>> li
相关文章
相关标签/搜索