CentOS7安装CDH 第一章:CentOS7系统安装html
CentOS7安装CDH 第二章:CentOS7各个软件安装和启动java
CentOS7安装CDH 第三章:CDH中的问题和解决方法python
CentOS7安装CDH 第四章:CDH的版本选择和安装方式mysql
CentOS7安装CDH 第五章:CDH的安装和部署-CDH5.7.0web
CentOS7安装CDH 第六章:CDH的管理-CDH5.12sql
CentOS7安装CDH 第七章:CDH集群Hadoop的HA配置shell
CentOS7安装CDH 第八章:CDH中对服务和机器的添加与删除操做数据库
CentOS7安装CDH 第九章:CDH中安装Kafkacentos
CentOS7安装CDH 第十章:CDH中安装Spark2服务器
service cloudera-scm-server start|stop|restart|status
service cloudera-scm-agent start|stop|restart|status
查看进程:jps / jps -l /jps –m
注意:
当使用jps命令时,出现以下情景:
1101 -- process information unavailable
但ps -ef|grep 1101 找不到该进程,那么就是残留文件,
此时cd /tmp/hsperfdata_hdfs/等相似文件夹中,找到 1101文件,删除便可。
1.su – mysqladmin service mysql start
2.service cloudera-scm-server start
3.service cloudera-scm-agent start (每台)
4.web: cms
5.web: cluster1
1.web: cluster1
2.web: cms
3.service cloudera-scm-agent stop (每台)
4.service cloudera-scm-server stop
5.su – mysqladmin service mysql stop
cms 和 cluster1 不管哪一个关闭、启动等等操做,会形成web界面的图表的 不绘制情景,此时能够采起以下操做:
1.cms 和 cluster1 都要启动 ,稍微等待 ,正在恢复中(30s)
2.先cluster1关闭,再重启cms服务
这里使用了QQ邮箱的SMTP,须要获取QQ邮箱的受权码:
# 卸载原有邮箱服务,并安装新的邮箱服务
yum remove postfix
yum install postfix
# 关闭机器的sendmail服务
systemctl stop sendmail.service
systemctl disable sendmail
# 开启postfix服务
systemctl start postfix.service
systemctl enable postfix
mkdir -p /root/.certs/
echo -n | openssl s_client -connect smtp.qq.com:465 | sed -ne '/-BEGINCERTIFICATE-/,/-END CERTIFICATE-/p' > ~/.certs/qq.crt
certutil -A -n "GeoTrust SSL CA" -t "C,," -d ~/.certs -i ~/.certs/qq.crt
certutil -A -n "GeoTrust Global CA" -t "C,," -d ~/.certs -i ~/.certs/qq.crt
certutil -L -d /root/.certs
cd /root/.certs
certutil -A -n "GeoTrust SSL CA - G3" -t "Pu,Pu,Pu" -d ./ -i qq.crt
set from=1043797615@qq.com
set smtp=smtp.qq.com
set smtp-auth-user=1043797615
#受权码
set smtp-auth-password=cgnrvyvbbsufbcbd
set smtp-auth=login
set smtp-use-starttls
set ssl-verify=ignore
set nss-config-dir=/root/.certs
echo hello word | mail -s " title" 1028344078@qq.com
# 此时1028344078@qq.com 会收到一封邮件
#查看 Alert 服务的 log
tail -F /var/log/cloudera-scm-alertpublisher/mgmt-cmf-mgmt-ALERTPUBLISHER-hadoop35.log.out
# 实时查看Linux中的邮件日志
tail -f /var/log/maillog
选择警报,再选择编辑收件人:
点击发送测试警报,对应的邮箱会收到测试邮件。
在Alert Publisher服务中,默认的邮件发件人地址以下,当邮件发送过多时,邮件的服务商会默认设置此地址为骚扰邮件,以后就不能接收到警告邮件了,此时能够在邮件网页中,点击回复,给此地址回复一封邮件,创建信任关系,就能够继续收到此地址发送的邮件了。
在CDH中有以下服务:
db(mysql)
server (cmf)
agent 本次被删除了
cms(5个进程,amon )
HDFS/yarn/zk/hive 元数据
CDH集群中,CM的server须要引用数据库中的cmf库,cms(Cloudera Management Service)须要引用数据库中的amon库,因此当数据库不能使用时,CDH集群启动不了,CDH中的数据库配置在/etc/cloudera-scm-server/db.properties路径中。(在cms中,一共有5个子服务)
1.此时先检查节点中agent的状态,将agent的遗留文件删除。
2.进入/var/www/html/cm5/redhat/7/x86_64/cm/5.12.0/RPMS/x86_64文件夹中,安装agent服务,安装命令:yum install cloudera-manager-agent-5.12.0-1.cm5120.p0.120.el7.x86_64.rpm。
3.进入/etc/cloudera-scm-agent文件夹中,配置config.ini配置文件。
4.修改其中的server_host为cm的server安装机器的IP地址(能够查看其余能运行的节点的该配置文件的IP地址)。
5.使用service cloudera-scm-agent start命令启动该节点的agent,再去web界面重启CMS。
上述问题说明CMS也是经过agent来启动和管理的。
当CDH的启动异常,并报以下错误时有几种解决方法:
Caused by: java.net.BindException: Address already in use
一、此时为地址被占用,使用ps/netstat查看该进程号,并kill掉该进程便可。
例:
ps -ef | grep alert #查看alert的进程号
netstat -nlp |grep 12704 #查看该进程的端口号
kill -9 12704 #kill掉该进程,而后再查看端口号便可
二、能够在web界面将有问题的服务删除,在添加该实例:
三、能够将cloudera-scm-agent服务中止,在kill父进程super(ps –ef|grep super),而后再启动cloudera-scm-agent服务,再去web界面重启。
四、实在不行重启服务器
stdout/stderr/role log
查看顺序:role log -> stderr -> stdout