Hadoop 基础和 伪分布式环境

1.HDFS架构html NomeNode --> DataNodejava 2.YARN架构node  资源调度,管理linux 3.MapReduce计算架构web map:并行处理输入数据shell reduce:对map结果进行汇总apache shuffle链接map和reduc两个阶段浏览器 仅适合离线批处理:具备很好的容错性和扩展性;合适简单的批处理任务服务器 缺点:启动开销大,过可
相关文章
相关标签/搜索