spark基本概念——spark Core

spark优点:数组 速度快(相比hadoop) 迭代式、交互式 弹性数据集,容错 支持有向无环图的数据优化缓存 (相比于mapreduce:mapreduce自身不支持交互,要支持交互,须要hive等,有交互接口)架构   spark的几种运行模式:框架 批处理:用于大规模的额分布式数据处理机器学习 流方式:spark流用于传送和处理实时数据分布式 交互方式:经常使用于处理在内存中的大块数据,较
相关文章
相关标签/搜索