Spark学习—— (5) RDD基础编程(基于Python)

RDD是Spark中最基本的数据抽象。虽然Spark2.x中建议使用效率更高的DataSet代替RDD,但仍是有必要学习一下RDD的相关知识。html 本文第一部分简单介绍RDD的一些基本概念,第二部分则介绍RDD的经常使用操做并给出例子。web 另外,本文介绍的操做不涉及到键值对RDD的操做,然而键值对RDD是许多操做所须要的常见数据类型,这部份内容会在下一篇笔记中补充。缓存 文章目录 1. R
相关文章
相关标签/搜索