跟天齐老师学Spark(6)--Spark的经常使用算子介绍

spark的经常使用算子介绍: Resilient(弹性且可复原) Distributed(分布式) Datasets(数据集) (RDDs) 咱们之前学的scala的原生方法都是数组或者集合上定义的,它只能操做单机。 而spark中的方法都是定义在RDD上的,它们操做的是集群。 spark的方法有两类操做: 一种是:Transformations,它是lazy的,不会触发任务的执行,是一种转换
相关文章
相关标签/搜索