Spark Storage概述

概述 Spark的Storage模块负责RDD(persist或cache)、Shuffle中间结果、Broadcast变量的存储及管理。 设计 组件 Storage模块抽象出BlockManager,提供公有的putXXX、getXXX方法供其他模块调用而无需关心其实现细节,BlockManager实现涉及的其他主要class如下(按原始数据和元数据管理分) BlockStore 以block为
相关文章
相关标签/搜索