Spark架构原理-Cache原理剖析和源码分析

原文地址:https://blog.csdn.net/zhanglh046/article/details/78486318java Task运行的时候是要去获取Parent的RDD对应的Partition的数据的,即它会调用RDD的iterator方法把对应的Partition的数据集给遍历出来,而后写入存储,这个存储多是磁盘或者内存,取决于StorageLevel是什么。缓存 若是当前RDD的
相关文章
相关标签/搜索