Hadoop大数据生态系统介绍

Hadoop大数据生态系统介绍 一、Hadoop 是一个可以对大量数据进行分布式处理的软件框架。具备可靠、高效、可伸缩的特色。 Hadoop的核心是HDFS和Mapreduce,hadoop2.0还包括YARN。 二、HDFS Hadoop的分布式文件系统。是Hadoop体系中数据存储管理的基础。它是一个高度容错的系统,能检测和应对硬件故障,用于在低成本的通用硬件上运行。HDFS简化了文件的一致性
相关文章
相关标签/搜索