Hadoop入门（5）--HDFS

时间 2019-11-12

标签 hadoop 入门 hdfs 栏目 Hadoop 繁體版

原文原文链接

HDFS简介

Hadoop的文件系统node

1 Block(块)
HDFS将文件分配成block来存储，每一个块默认64MB，块是文件存储处理的逻辑单元，按照block管理
2 NameNode
管理节点，存放元数据网络

为了保证硬件上的容错，每一个数据块3个副本，分布在两个机架内的三个节点（两份在同一个机架）。一个机架故障不影响。
并发

NameNode和DataNode之间有心跳协议，
DataNode按期向NameNode发送心跳信息（网络关机）
Secondary NameNode
NameNode的备份，按期同步元数据映像文件和修改日志
故障时转正
oop

读取
- 客户端先在NameNode查找DataNode的位置
- 再按照位置在datanode中找到，下载下来

写入ui

可视化操做日志

hadoop namenode -format

查看文件夹code

hadoop fs -ls/

提交orm

hadoop fs -put hadoop-env.sh 目录

从HDFS下载

hadoop fs -get input/hadoop-env.sh hadoop-env2.sh

hadoop fs -get (HDFS目录) (另命名)

看文件系统全部信息

hadoop dfsadmin -report