《Learning Spark》第三章:使用RDD进行编程

2020/06/30 - 2020/06/30 21:30形成初稿 引言 本章节主要介绍关于RDD两种基础操作。对于一般的spark数据分析应用而言,大致的流程如下: 创建RDD(从外界导入数据); 对RDD进行一系列的操作; 最后将RDD的结果保存; 本章将按照《Learning Spark》(2015年第一版)中的脉络来梳理这部分内容。 实际上,对于结构化的数据来说,Spark支持利用Data
相关文章
相关标签/搜索