Spark实战学习

1.什么是Spark?   2.为什么要使用Spark? 因为Hadoop在处理数据的时候有多次的IO和网络操作,Mapreduce都要转成map,shuffle和reduce等核心阶段,而且任务之间是串行执行的 Spark对比Hadoop MR的特点 内存计算比mr快100倍,磁盘计算快mr10倍 使用方便,安装部署简单,支持交互式 支持处理丰富 继承hadoop,能都读取hadoop上的数据,
相关文章
相关标签/搜索