Hadoop经常使用命令总结

1、前述node

分享一篇hadoop的经常使用命令的总结,将经常使用的Hadoop命令总结以下。linux

2、具体centos

一、启动hadoop全部进程
start-all.sh等价于start-dfs.sh + start-yarn.sh安全

可是通常不推荐使用start-all.sh(由于开源框架中内部命令启动有不少问题)。负载均衡


二、单进程启动。框架

sbin/start-dfs.shoop

---------------atom

    sbin/hadoop-daemons.sh --config .. --hostname .. start namenode ...
    sbin/hadoop-daemons.sh --config .. --hostname .. start datanode ...
    sbin/hadoop-daemons.sh --config .. --hostname .. start sescondarynamenode ...
    sbin/hadoop-daemons.sh --config .. --hostname .. start zkfc ...         //spa

 

sbin/start-yarn.sh
--------------  
    libexec/yarn-config.sh
    sbin/yarn-daemon.sh --config $YARN_CONF_DIR  start resourcemanager
    sbin/yarn-daemons.sh  --config $YARN_CONF_DIR  start nodemanagerxml

三、经常使用命令

    一、查看指定目录下内容

   hdfs dfs –ls [文件目录]

    hdfs dfs -ls -R   /                   //显式目录结构

    eg: hdfs dfs –ls /user/wangkai.pt

   二、打开某个已存在文件

    hdfs dfs –cat [file_path]

   eg:hdfs dfs -cat /user/wangkai.pt/data.txt

  三、将本地文件存储至hadoop

     hdfs dfs –put [本地地址] [hadoop目录]

     hdfs dfs –put /home/t/file.txt  /user/t  

  四、将本地文件夹存储至hadoop

    hdfs dfs –put [本地目录] [hadoop目录] 
    hdfs dfs –put /home/t/dir_name /user/t

   (dir_name是文件夹名)

  五、将hadoop上某个文件down至本地已有目录下

     hadoop dfs -get [文件目录] [本地目录]

     hadoop dfs –get /user/t/ok.txt /home/t

  六、删除hadoop上指定文件

     hdfs  dfs –rm [文件地址]

     hdfs dfs –rm /user/t/ok.txt

  七、删除hadoop上指定文件夹(包含子目录等)

     hdfs dfs –rm [目录地址]

     hdfs dfs –rmr /user/t

  八、在hadoop指定目录内建立新目录

      hdfs dfs –mkdir /user/t

      hdfs  dfs -mkdir - p /user/centos/hadoop 

  九、在hadoop指定目录下新建一个空文件

    使用touchz命令:

    hdfs dfs  -touchz  /user/new.txt

  十、将hadoop上某个文件重命名

   使用mv命令:

   hdfs dfs –mv  /user/test.txt  /user/ok.txt   (将test.txt重命名为ok.txt)

  十一、将hadoop指定目录下全部内容保存为一个文件,同时down至本地

   hdfs dfs –getmerge /user /home/t

  十二、将正在运行的hadoop做业kill掉

   hadoop job –kill  [job-id]

  13.查看帮助

  hdfs dfs -help        

四、安全模式

  (1)退出安全模式

      NameNode在启动时会自动进入安全模式。安全模式是NameNode的一种状态,在这个阶段,文件系统不容许有任何修改。

      系统显示Name node in safe mode,说明系统正处于安全模式,这时只须要等待十几秒便可,也可经过下面的命令退出安全模式:/usr/local/hadoop$bin/hadoop dfsadmin -safemode leave

  (2) 进入安全模式
    在必要状况下,能够经过如下命令把HDFS置于安全模式:/usr/local/hadoop$bin/hadoop dfsadmin -safemode enter

 

五、节点添加

添加一个新的DataNode节点,先在新加节点上安装好Hadoop,要和NameNode使用相同的配置(能够直接从NameNode复制),修改HADOOPHOME/conf/masterNameNodeNameNodeHADOOPHOME/conf/master文件,加入NameNode主机名。而后在NameNode节点上修改HADOOP_HOME/conf/slaves文件,加入新节点名,再创建新加节点无密码的SSH链接,运行启动命令为:/usr/local/hadoop$bin/start-all.sh

 

六、负载均衡

HDFS的数据在各个DataNode中的分布可能很不均匀,尤为是在DataNode节点出现故障或新增DataNode节点时。新增数据块时NameNode对DataNode节点的选择策略也有可能致使数据块分布不均匀。用户可使用命令从新平衡DataNode上的数据块的分布:/usr/local/hadoop$bin/start-balancer.sh

七、补充

1.对hdfs操做的命令格式是hdfs dfs  1.1 -ls 表示对hdfs下一级目录的查看1.2 -lsr 表示对hdfs目录的递归查看1.3 -mkdir 建立目录1.4 -put 从Linux上传文件到hdfs1.5 -get 从hdfs下载文件到linux1.6 -text 查看文件内容1.7 -rm 表示删除文件1.7 -rmr 表示递归删除文件2.hdfs在对数据存储进行block划分时,若是文件大小超过block,那么按照block大小进行划分;不如block size的,划分为一个块,是实际数据大小。*****PermissionDenyException  权限不足**********  hadoop经常使用命令:  hdfs dfs  查看Hadoop HDFS支持的全部命令   hdfs dfs –ls  列出目录及文件信息   hdfs dfs –lsr  循环列出目录、子目录及文件信息   hdfs dfs –put test.txt /user/sunlightcs  将本地文件系统的test.txt复制到HDFS文件系统的/user/sunlightcs目录下   hdfs dfs –get /user/sunlightcs/test.txt .  将HDFS中的test.txt复制到本地文件系统中,与-put命令相反   hdfs dfs –cat /user/sunlightcs/test.txt  查看HDFS文件系统里test.txt的内容   hdfs dfs –tail /user/sunlightcs/test.txt  查看最后1KB的内容   hdfs dfs –rm /user/sunlightcs/test.txt  从HDFS文件系统删除test.txt文件,rm命令也能够删除空目录   hdfs dfs –rmr /user/sunlightcs  删除/user/sunlightcs目录以及全部子目录   hdfs dfs –copyFromLocal test.txt /user/sunlightcs/test.txt  从本地文件系统复制文件到HDFS文件系统,等同于put命令   hdfs dfs –copyToLocal /user/sunlightcs/test.txt test.txt  从HDFS文件系统复制文件到本地文件系统,等同于get命令   hdfs dfs –chgrp [-R] /user/sunlightcs  修改HDFS系统中/user/sunlightcs目录所属群组,选项-R递归执行,跟linux命令同样   hdfs dfs –chown [-R] /user/sunlightcs  修改HDFS系统中/user/sunlightcs目录拥有者,选项-R递归执行   hdfs dfs –chmod [-R] MODE /user/sunlightcs  修改HDFS系统中/user/sunlightcs目录权限,MODE能够为相应权限的3位数或+/-{rwx},选项-R递归执行hdfs dfs –count [-q] PATH  查看PATH目录下,子目录数、文件数、文件大小、文件名/目录名   hdfs dfs –cp SRC [SRC …] DST       将文件从SRC复制到DST,若是指定了多个SRC,则DST必须为一个目录   hdfs dfs –du PATH  显示该目录中每一个文件或目录的大小   hdfs dfs –dus PATH  相似于du,PATH为目录时,会显示该目录的总大小   hdfs dfs –expunge  清空回收站,文件被删除时,它首先会移到临时目录.Trash/中,当超过延迟时间以后,文件才会被永久删除   hdfs dfs –getmerge SRC [SRC …] LOCALDST [addnl]      获取由SRC指定的全部文件,将它们合并为单个文件,并写入本地文件系统中的LOCALDST,选项addnl将在每一个文件的末尾处加上一个换行符   hdfs dfs –touchz PATH   建立长度为0的空文件   hdfs dfs –test –[ezd] PATH     对PATH进行以下类型的检查:  -e PATH是否存在,若是PATH存在,返回0,不然返回1  -z 文件是否为空,若是长度为0,返回0,不然返回1  -d 是否为目录,若是PATH为目录,返回0,不然返回1   hdfs dfs –text PATH  显示文件的内容,当文件为文本文件时,等同于cat,文件为压缩格式(gzip以及hadoop的二进制序列文件格式)时,会先解压缩    hdfs dfs –help ls  查看某个[ls]命令的帮助文档

相关文章
相关标签/搜索