spark生态及运行原理

spark 生态及运行原理 spark 特点 运行速度快 => Spark拥有DAG执行引擎,支持在内存中对数据进行迭代计算。 适用场景广泛 => 大数据分析统计,实时数据处理,图计算及机器学习 易用性 => 编写见到那,支持80多种以上的高级算子,支持多种语言,数据源丰富,可部署在多种集群中 容错性高 => Spark引进了弹性分布式数据集RDD,它是分布在一组节点中的只读对象集合,这些集合是弹
相关文章
相关标签/搜索