Spark-core 运行机理

一个简单的例子 // 须要对名为逗hello.txt地的HDFS文件进行一次map操做,再进行一次reduce操做。也就是说,须要对一份数据执行两次算子操做。 // 错误的作法:对于同一份数据执行屡次算子操做时,建立多个RDD。 // 这里执行了两次textFile方法,针对同一个HDFS文件,建立了两个RDD出来,而后分别对每一个RDD都执行了一个算子操做。 // 这种状况下,Spark须要从H
相关文章
相关标签/搜索