Spark的深刻浅出

Spark的简介 维基百科: Apache Spark是一个开源的集群运算框架,最初是由加州大学柏克莱分校AMPLab所开发.相对于Hadoop的MapReduce会在运行完工做后将中介数据存放到磁盘中,Spark使用了内存运算技术,能在数据还没有写入硬盘时在内存分析运算.Spark在内存内运算速度能作到比Hadoop MapReduce的运算速度快100倍,即使是运行程序于硬盘时,Spark也能
相关文章
相关标签/搜索