Spark入门简介

定义 分布式批处理系统和分析挖掘引擎。   特性 1、高效性。Spark基于内存的运算要快100倍以上,基于硬盘的运算也要快10倍以上。Spark实现了高效的DAG(无回路有向图)执行引擎,可以通过基于内存来高效处理数据流。 2、易用性。Spark支持Java、Python和Scala的API,还支持超过80种高级算法,使用户可以快速构建不同的应用。 3、通用性。Spark提供了统一的解决方案。S
相关文章
相关标签/搜索