Spark:一个高效的分布式计算系统

本文转自:http://tech.uc.cn/?p=2116java ---python 概述 什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具备的优势;但不一样于MapReduce的是Job中间输出和结果能够保存在内存
相关文章
相关标签/搜索