注意:
Cloudera建议按期备份HDFS元数据,以及重大升级以前。
在备份以前,中止群集。 NameNode角色进程没有运行是很是重要的,所以您能够进行一致的备份。html
中止要备份的NameNode。
转到HDFS服务。
选择配置>查看和编辑。
在搜索字段中,搜索“NameNode数据目录”。 这找到NameNode数据目录属性。
从NameNode主机上的命令行备份NameNode Data Directories属性中列出的目录。 若是列出了多个目录,则只须要对一个目录进行备份,由于每一个目录都是完整的副本。 例如,若是数据目录是/ mnt / hadoop / hdfs / name,请以root身份执行如下操做:oop
# cd /mnt/hadoop/hdfs/name # tar -cvf /root/nn_backup_data.tar .
你应该看到这样的输出:命令行
./ ./current/ ./current/fsimage ./current/fstime ./current/VERSION ./current/edits ./image/ ./image/fsimage
警告:若是您看到包含单词锁的文件,NameNode可能仍在运行。 重复上述步骤,首先关闭CDH服务。htm
参考资料:进程
http://www.cloudera.com/documentation/manager/5-0-x/Cloudera-Manager-Managing-Clusters/cm5mc_hdfs_metadata_backup.htmlhadoop