spark基础

1. Spark概述 1.1Spark是什么 Spark是内存计算系统,2009年它出品于UCBerkeley AMPLab伯克利下属实验室,它最早是一片博士论文,论述如何提高map和reduce的效率。后来就针对这篇论文写出了相应的实现。2013年6月捐赠了给Apache,2014年2月成为Apache的顶级项目。 最大节点的集群来自腾讯,8000个节点,单个job最大分别是阿里巴巴和Datab
相关文章
相关标签/搜索