spark源码阅读——3. cache和persist

缓存策略 cache和persist缓存 点进去cache,能够看到它调用了persist(),没有给参数,spa 也就是默认的缓存级别,MEMORY_ONLY内存     存储块block和partition关系hash rdd的运算是基于分区partition的,partition是逻辑上的概念,it block是物理上的数据实体spark 一个rdd的partition就对应一个storag
相关文章
相关标签/搜索