SparkRDD经常使用算子实践(附运行效果图)

目录 一、简单算子说明 二、复杂算子说明 目录 SparkRDD算子分为两类:Transformation与Action. Transformation:即延迟加载数据,Transformation会记录元数据信息,当计算任务触发Action时,才会真正开始计算。 Action:即当即加载数据,开始计算。 建立RDD的方式有两种: 一、经过sc.textFile(“/root/words.txt”
相关文章
相关标签/搜索