Cloudera Certified Associate Administrator案例之Configure篇
node
做者:尹正杰后端
版权声明:原创做品,谢绝转载!不然将追究法律责任。服务器
一.下载CDH集群中最新的配置文件oop
问题描述:
某个集群的使用者须要经过客户端登录集群,请使用CM下载HDFS和YARN的配置文件,保存到客户端机器的"/home/yinzhengjie/hadoop/etc/hadoop"目录下,并保持文件名不变。
解决方案:
能够经过登录CM WebUI界面下载,也能够直接登录服务器进行下载。
1>.使用正确的用户名密码登陆CM界面,点击hdfs服务spa
2>. 下载HDFS的配置文件3d
3>.使用正确的用户名密码登陆CM界面,点击yarn服务日志
4>.下载YARN服务的配置文件code
5>.查看集群后端存储配置文件的路径xml
[root@node101.yinzhengjie.org.cn ~]# ll /etc/hadoop/conf.cloudera.hdfs/ #HDFS集群存储路径 total 36 -rw-r--r-- 1 root root 19 Jun 14 12:27 __cloudera_generation__ -rw-r--r-- 1 root root 66 Jun 14 12:27 __cloudera_metadata__ -rw-r--r-- 1 root root 3556 Jun 14 12:27 core-site.xml -rw-r--r-- 1 root root 2696 Jun 14 12:27 hadoop-env.sh -rw-r--r-- 1 root root 1786 Jun 14 12:27 hdfs-site.xml -rw-r--r-- 1 root root 314 Jun 14 12:27 log4j.properties -rw-r--r-- 1 root root 315 Jun 14 12:27 ssl-client.xml -rw-r--r-- 1 root root 634 Jun 14 12:27 topology.map -rwxr-xr-x 1 root root 1594 Jun 14 12:27 topology.py [root@node101.yinzhengjie.org.cn ~]# [root@node101.yinzhengjie.org.cn ~]# [root@node101.yinzhengjie.org.cn ~]# [root@node101.yinzhengjie.org.cn ~]# ll /etc/hadoop/conf.cloudera.yarn/ #YARN集群存储路径 total 48 -rw-r--r-- 1 root root 21 Jun 14 12:42 __cloudera_generation__ -rw-r--r-- 1 root root 66 Jun 14 12:42 __cloudera_metadata__ -rw-r--r-- 1 root root 3869 Jun 14 12:42 core-site.xml -rw-r--r-- 1 root root 617 Jun 14 12:42 hadoop-env.sh -rw-r--r-- 1 root root 1786 Jun 14 12:42 hdfs-site.xml -rw-r--r-- 1 root root 314 Jun 14 12:42 log4j.properties -rw-r--r-- 1 root root 5154 Jun 14 12:42 mapred-site.xml -rw-r--r-- 1 root root 315 Jun 14 12:42 ssl-client.xml -rw-r--r-- 1 root hadoop 634 Jun 14 16:41 topology.map -rwxr-xr-x 1 root hadoop 1594 Jun 14 16:41 topology.py -rw-r--r-- 1 root root 3653 Jun 14 12:42 yarn-site.xml [root@node101.yinzhengjie.org.cn ~]# [root@node101.yinzhengjie.org.cn ~]#
二.限制HDFS服务的日志大小blog
问题描述:
根据管理要求,须要限制HDFS服务的日志大小。其限制为:NameNode服务保留4个日志文件,总量不超过8GB;Secondary NameNode 服务也保留4个日志文件,总量不超过8GB;两个服务总占用的磁盘空间 量不超过16GB。
解决方案:
单个服务的单个日志只要不超 过2GB,并将日志数设为4个,便可以知足要求。
1>.使用正确的用户名密码登陆CM界面,点击hdfs服务
2>.搜索关键字“NameNode Max Log Size”
3>.修改默认值200MB为2GB并点击保存按钮
4>.搜索关键字“SecondaryNameNode Max Log Size”(中文对应:"SecondaryNameNode 最大日志文件备份")
5>.修改日志文件的备份数为4
6>.重启HDFS服务
三.修改Namenode的堆内存
问题描述:
集群承接了日志分析需求,将保存百万、千万数量级的文件,因 此须要扩大NameNode使用的堆内存,使其能够管理尽量多的文件。物理内存的分配要求为:节点总物理内存为31GB,为系统服务保留的内存为6.2GB;NameNode和Secondary NameNode需设置相等大小的堆内存; 全部服务的堆内存均须要乘以1.3后计入总使用量中。须要为NameNode和相关服务配置尽量大且知足要求的内存量,且不能触发任何警告。
解决方案:
根据计算(31 - 6.2) / 1.3 = 19,所以 NameNode和Secondary NameNode各可设置9.5GB的堆内存。
1>.使用正确的用户名密码登陆CM界面,点击hdfs服务
2>.点击配置,搜索关键字“Java Heap Size of NameNode in Bytes”(对应中文为:"NameNode 的 Java 堆栈大小(字节)")
3>.设置NameNode和SencondName的堆内存为9.5GB
4>.重启HDFS集群(须要注意的是,若是咱们设置的NameNode或者SecondNamenode的堆内存大小总和大于当前服务器内存时,咱们在重启集群时会启动失败!)
四.
五.