Spark学习笔记四:算子

一、什么是算子 算子是RDD中定义的函数,可以对RDD中的数据进行转换和操作(transformation和action) transformation不触发提交作业;action出发SparkContext提交Job作业 二、常用算子不完全归纳 Transformation转换操作 基础转换操作 map、mapPartitions、mapPartitionsWithIndex distinct:
相关文章
相关标签/搜索