Spark教程(Python版)笔记

Spark教程(Python版) 1.1 Spark简介 Spark是 [基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序][6]。 Spark具有如下几个主要特点: [运行速度快:][6]使用先进的DAG(Directed Acyclic Graph,有向无环图)执行引擎,以支持循环数据流与内存计算,基于内存的执行速度可比Hadoop MapReduce快上百倍,基于
相关文章
相关标签/搜索