第一天:spark基础

Hadoop体系回顾 Hadoop 的概念可追溯到 2003,2004 Google2篇论文(老版三辆马车),2011年发布1.0版本,2012年发布稳定版。 Hadoop 在2.0版本以前组件主要是 HDFS跟MapReduce。html 1.0版本框架主要以下: 职责:java HDFS负责文件存储 MapReduce负责资源调度跟计算node 缺点:git mr基于数据集的计算,因此面向数据
相关文章
相关标签/搜索