Hadoop的文件系统node
1 Block(块)
HDFS将文件分配成block来存储,每一个块默认64MB,块是文件存储处理的逻辑单元,按照block管理
2 NameNode
管理节点,存放元数据网络
为了保证硬件上的容错,每一个数据块3个副本,分布在两个机架内的三个节点(两份在同一个机架 )。一个机架故障不影响。
并发
NameNode和DataNode之间有心跳协议,
DataNode按期向NameNode发送心跳信息(网络 关机)
Secondary NameNode
NameNode的备份,按期同步元数据映像文件和修改日志
故障时转正
oop
读取
- 客户端先在NameNode查找DataNode的位置
- 再按照位置在datanode中找到,下载下来
写入ui
更新NameNode
spa
1 数据冗余 硬件容错
* 2 流式的数据访问*
3 存储大文件 不适合存储大量小文件
4 适合数据批量读写 吞吐量高
不适合交互式应用 高延迟
5适合一次写入屡次读取,顺序读写
不支持多用户并发写相同文件设计
可视化操做日志
hadoop namenode -format
查看文件夹code
hadoop fs -ls/
提交orm
hadoop fs -put hadoop-env.sh 目录
从HDFS下载
hadoop fs -get input/hadoop-env.sh hadoop-env2.sh
hadoop fs -get (HDFS目录) (另命名)
看文件系统全部信息
hadoop dfsadmin -report