spark部分:spark的四种运行模式,Spark 比 MapReduce 快的缘由,spark执行程序流程,spark算子种类,spark持久化算子,cache 和 persist,调节参数的方式

Spark 有 4 中运行模式: 算法 1. local 模式,适用于测试数据库 2. standalone,并不是是单节点,而是使用 spark 自带的资源调度框架app 3. yarn,最流行的方式,使用 yarn 集群调度资源框架 4. mesos,国外使用的多机器学习 Spark 比 MapReduce 快的缘由函数 1. Spark 基于内存迭代,而 MapReduce 基于磁盘迭代oo
相关文章
相关标签/搜索