Spark学习1 初识Hadoop

Hadoop是什么 Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现的开源软件框架,在大量计算机组成的集群中对海量数据实现分布式计算。 Hadoop生态圈 Hadoop框架的最核心设计:HDFS和MapReduce。 HDFS—Hadoop分布式文件系统,提供海量数据的存储。是一种数据分布式保存机制,数据被保存在计算机集群上。 HDFS的关键元素: 1)
相关文章
相关标签/搜索