4.Spark Core 应用解析之RDD经常使用转换操做

时间 2020-05-08

标签 4.spark spark core 应用解析 rdd 经常使用转换栏目 Spark 繁體版

原文原文链接

RDD中的全部转换都是延迟加载的，也就是说，它们并不会直接计算结果。相反的，它们只是记住这些应用到基础数据集（例如一个文件）上的转换动做。只有当发生一个要求返回结果给Driver的动做时，这些转换才会真正运行。这种设计让Spark更加有效率地运行linux 1.map(func) 返回一个新的RDD，该RDD由每个输入元素通过func函数转换后组成es6 将原来 RDD 的每一个数

>>阅读原文<<