初识Spark

Spark基础及架构 Spark是类Hadoop MapReduce的通用并行框架 Job中间输出结果可以保存在内存,不再需要读写HDFS 比MapReduce平均快10倍以上 Spark优势 速度快 1. 基于内存数据处理,比MR快100个数量级以上(逻辑回归算法测试 2. 基于硬盘数据处理,比MR快10个数量级以上 易用性 1. 支持Java、Scala、Python、R语言 2. 交互式sh
相关文章
相关标签/搜索