Spark内核:RDD的算子

RDD的算子 一般来说,RDD的整个计算过程都是发生在Worker节点中的Executor中的。RDD可以支持三种操作类型:Transformation、Action以及Persist和CheckPoint为代表的控制类型操作。 RDD一般是从外部数据源读取数据的,经过多次的Transformation(中间应该有Persist和CheckPoint操作),最终通过Action类型的操作将结果写入
相关文章
相关标签/搜索