spark 基础 上

Spark 是专为大规模数据处理而设计的快速通用的计算引擎,是apache的一个开源项目。是一种跟hadoop相似的通用分布式并行计算框架,但是两者之间还存在一些不同之处。spark是一种基于内存计算的分布式执行框架,在执行速度上大大优于hadoop. 1. spark的历史 2009年,spark诞生于加州大学伯克利分校AMPLab. 2010和2012年关于spark的两篇论文发表:M. Za
相关文章
相关标签/搜索