Hadoop 基本架构

Hadoop 由两部分组成,分别是分布式文件系统和分布式计算框架 MapReduce。 其中分布式文件系统主要用于大规模数据的分布式存储,而 MapReduce 则构建在分布式文件系统之上,对存储在分布式文件系统中的数据进行分布式计算。本文主要涉及 MapReduce,但考虑到它的一些功能跟底层存储机制相关,因而会首先介绍分布式文件系统。 在 Hadoop 中, MapReduce 底层的分布式文
相关文章
相关标签/搜索