HDFS操做文件的基本命令html
1.建立文件夹 $>hdfs dfs -mkdir /user/centos/hadoop
2.展现目录 $>hdfs dfs -ls -r /user/centos/hadoop
3.递归展现 $>hdfs dfs -lsr /user/centos/hadoop
4.上传文件 $>hdfs dfs -put index.html /user/centos/hadoop
5.下载文件 $>hdfs dfs -get /user/centos/hadoop/index.html a.html
6.删除文件 $>hdfs dfs -rm -r -f /user/centos/hadoopnode
----------------centos
HDFS存储
500G 文件
1024G = 2T/4T 文件
切割。
//切割
block: 切割:128M 缘由: 让寻址时间占用读取时间的1%.
寻址时间:10ms左右
磁盘速率 : 100M /s【磁盘I/O】oop
HDFS 文件存储: >128M的切割分块。 若是配置了备份数,则按照备份数进行备份 放到各个数据节点spa
size = 181260798
block-0 : 134217728
block-1 : 47043070
--------------------xml
b0.no : 1073741829
b1.no : 1073741830htm
找到全部的配置文件
----------------------递归
1.tar开hadoop-2.7.3.tar.gz
hadoop-2.7.3\share\hadoop\common\hadoop-common-2.7.3.jar\core-default.xml 文件存放位置 fs.defaultFS=file:///
hadoop-2.7.3\share\hadoop\hdfs\hadoop-hdfs-2.7.3.jar\hdfs-default.xml 文件副本数 dfs.replication
hadoop-2.7.3\share\hadoop\mapreduce\hadoop-mapreduce-client-core-2.7.3.jar\mapred-default.xml
hadoop-2.7.3\share\hadoop\yarn\hadoop-yarn-common-2.7.3.jar\yarn-site.xmlhadoop
2.配置[core-site.xml]文件
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://s201/</value>
</property>
<!--- 配置新的本地目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/centos/hadoop</value>
</property>
</configuration>get
--------基本思路------------------------
1.hdfs dfs -mkdir /usr/centos/hadoop : 建立文件夹
2.hdfs dfs -lsr /usr/centos/hadoop :查看文件目录
3.hdfs dfs -put index.html /usr/centos/hadoop : 上传文件index.html 到 /usr/centos/hadoop
4.经过上传文件到hdfs后, namenode名称节点经过slave配置datanode数据节点后, nn(名称节点)的hdfs-site.xml中配置了副本数,nm(名称节点)的hdfs-site.xml中配置数据存放位置。若是上传的文件 大于128M,hdfs将会对文件进行切割,每块(blcok)128M[为了知足 寻址时间为读取文件是的的 1%]。