spark部分:spark的四种运行模式,Spark 比 MapReduce 快的原因,spark执行程序流程,spark算子种类,spark持久化算子,cache 和 persist,调节参数的方式

Spark 有 4 中运行模式: 1. local 模式,适用于测试 2. standalone,并非是单节点,而是使用 spark 自带的资源调度框架 3. yarn,最流行的方式,使用 yarn 集群调度资源 4. mesos,国外使用的多 Spark 比 MapReduce 快的原因 1. Spark 基于内存迭代,而 MapReduce 基于磁盘迭代 MapReduce 的设计:中间结果保
相关文章
相关标签/搜索