RDD 操作

RDD Operations:这些操作和Scala的操作几乎一样,就不细说了。 1.transformations:lazy的操作,不能立即计算结果。相反,Spark只记得应用于一些基本数据集(例如文件)的转换。只有当一个动作action需要返回到驱动程序的结果时才计算这些转换。这种设计使Spark能够更高效地运行。     RDDA==>RDDB (A转换到B,这是两个不同的RDD) 且通过记录
相关文章
相关标签/搜索