Hadoop学习

Hadoop学习笔记 Hadoop是什么 1、是一个开源的大数据框架 2、是一个分布式计算的解决方案 3、HDFS(分布式文件系统) + MapReduce(分布式计算) HDFS 数据块:抽象的概念而非整个文件作为存储单元,默认大小64M、 NameNode:管理文件系统的命名空间,存储文件元数据。维护文件系统所有的文件和目录,文件和数据块的映射。记录每个文件中各个块在数据节点的信息。 Data
相关文章
相关标签/搜索