Spark基础入门

最近在研究spark,spark现在可以算是最流行的大数据计算框架啦,mr只能进行离线计算的批处理,presto,implala进行交互式查询,storm只能进行流计算,而spark恰恰集成了这些。我这篇文章只进行基础入门的介绍(系统架构,运行模式)。 - spark和mr的比较 spark把计算中间数据放到内存(cache,persist),mr的map阶段和ruduce阶段都需要进行溢写落盘,
相关文章
相关标签/搜索