Hive-1-基础

Hadoop 简介 Hadoop是一个开源框架来存储和处理大型数据在分布式环境中。包含两个模块,一个是MapReduce,另一个是Hadoop分布式文件系统(HDFS)。 MapReduce:是一种并行编程模型,在大型集群普通硬件可用于处理大型结构化,半结构化和非结构化数据。 HDFS:Hadoop分布式文件系统是Hadoop框架的一部分,用于存储和处理数据集。提供了一个容错文件系统在普通硬件上运
相关文章
相关标签/搜索