Spark之CacheManager运行流程

Spark之CacheManager运行流程 CacheManager概述   CacheManager的功能是将RDD的数据进行持久化。当Task要针对一个RDD中的Partition进行计算时如果发现我们即将产生的RDD已经被CacheManager持久化了,那么我们可以直接拿到目标数据而无需再进行计算。 具体来说,我们的计算过程发生在RDD的iterator()方法中。当我们要拿的数据是已经
相关文章
相关标签/搜索