Spark核心RDD:计算函数compute

RDD的计算是惰性的,一系列转换操做只有在遇到动做操做是才会去计算数据,而分区做为数据计算的基本单位。在计算链中,不管一个RDD有多么复杂,其最终都会调用内部的compute函数来计算一个分区的数据。java 1.compute方法 RDD抽象类要求其全部子类都必须实现compute方法,该方法介绍的参数之一是一个Partition对象,目的是计算该分区中的数据。以 MapPartitionsRD
相关文章
相关标签/搜索