Hadoop生态圈

Hadoop框架 主要服务介绍 软件 解析 备注 HDFS 分布式存储数据,数据分散存储 一个存储文件在HDFS中被分成若干个小块,每个小块被存储在不同的服务器上 MapReduce 第一代分布式计算框架 — 分布式计算(将任务 分布在多个服务器上,服务器越多,计算越快) Map阶段—多台机器同时读取文件内容,分别做统计。Reduce阶段— 将Map结果作为输入,进行汇总,整理,输出结果 Tez、
相关文章
相关标签/搜索