大数据1 ---Spark 基础解析

Hadoop 历史   2003和2004年的Google两篇论文   发展历史: 2011年 1.0版本 2012年 稳定版本 2013年 2.x版本, YARN   MR的缺点:基于数据集的计算,面向数据,基本运算规则是从存储介质中获取(采集)数据,然后进行计算,将最后的结果存储回介质中,主要用于一次性计算。不适合数据挖掘和机器学习这样的一种迭代计算。MR是基于文件存储介质的计算,所以性能非常
相关文章
相关标签/搜索