使用阿里云服务器,离线搭建CDH集群

准备工做html

1.服务器java

关键词:mysql

  • 3台服务器linux

  • 配置要求至少2核8Ggit

  • 选择同地域同区域服务器,保证内网通畅github

我的学习,推荐使用阿里云按量付费的服务器,在使用时候开启,不适用的时候关机中止收费。web

需注意两点:sql

(1)服务器配置至少2核8G,不然CDH集群可能没法正常运行shell

(2)服务器要保证在同一地域的同一可用却,切记必定不能使用随机分配区域,不然不一样地域的实例之间内网互不相通json

1.png

阿里云的使用细节不作过多描述,不清楚的能够查看若泽数据课程:https://www.bilibili.com/video/av52167219/?p=3

按照操做,最终的配置以下:

image.png

2.安装包准备

CM

cloudera-manager-centos7-cm5.16.1x8664.tar.gz Parcel

CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel.sha1 manifest.json

JDK

https://www.oracle.com/technetwork/java/javase/downloads/java-archive-javase8-2177648.html

下载jdk-8u202-linux-x64.tar.gz

MySQL https://dev.mysql.com/downloads/mysql/5.7.html#downloads

下载mysql-5.7.26-el7-x86_64.tar.gz

MySQL jdbc jar

mysql-connector-java-5.1.47.jar

 下载完成后要重命名去掉版本号,

mv mysql-connector-java-5.1.47.jar mysql-connector-java.jar

2.规划

节点

MySQL部署组件

Parcel文件离线元

CM服务进程

大数据组件

hadoop001

MySQL

Parcel

Activity Monitor

NN RM DN NM

hadoop002



Alert Publisher

Event Server

DN NM

hadoop003



Host Monitor

Service Monitor

DN NM

3.集群节点初始化

1.配置host

vim /etc/hosts

172.26.84.187 hadoop001

172.26.84.188 hadoop002

172.26.84.189 hadoop003

image.png

2.配置防火墙(详细介绍阿里云服务器)

(1)若是使用内部服务器,建议先关闭防火墙,集群搭建起以后,再开启相关端口。防火墙相关命令,自行查找。

(2)阿里云服务器默认防火墙为关闭状态,在阿里云的web界面,找到服务器的安全组,对服务器的安全组进行配置,操做以下

1.进入服务器列表,找到 安全组配置

image.png

2.点击配置规则

image.png

3.添加配置规则

图中的规则表明:开启7180到7180直接的端口号,受权对象,即访问限制的ip为0.0.0.0/0,即全部ip地址都可访问该web端口。

image.png

3.时区设置,timezone和datatime同步(阿里云时间基本不会出问题,方法二可跳过)

(1) 经过date命令以及timedatectl,查找集群每台机器时间是否一致、时区是否一致以及是否为CST格式的时间。

CST被视为美国、澳大利亚、古巴或中国的标准时间

image.png

若是时区不一致,使用timedatectl --help查看相关命令

使用list-timezones查看时区列表

set-timezone Asia/Shanghai

(2)使用ntp服务设置时区

yum install -y ntp

使用hadoop001 做为时间同步的主节点

hadoop002-003做为时间同步的从节点

设置主节点

vim /etc/ntp.conf

#time

#这个是互联网同步亚洲时区

server 0.asia.pool.ntp.org

server 1.asia.pool.ntp.org

server 2.asia.pool.ntp.org

server 3.asia.pool.ntp.org

#这步很重要,若是该服务器网络出问题了,就同步本身的本地时间

server 127.127.1.0 iburst local clock

#这个是容许客户端172.26.84段的地址能够同步该时间同步服务器。

restrict 172.26.84.0  mask 255.255.255.0  nomodify  notrap

image.png

systemctl start ntpd 重启ntpdfuwu

systemctl status ntpd 查看ntpd服务状态,当现实为runnig的时候,说明已经开始服务

ntpq -p 查看验证结果

三条命令的操做结果以下

image.png

设置从节点

关闭从节点ntpd服务,不然从节点也是使用ntpd网络设置时间

systemctl stop ntpd

systemctl disable ntpd

在从节点使用 /usr/bin/ntpstat hadoop001 表示同步hadoop001节点时间

4.JDK安装

路径:/usr/java

解压以后的用户及用户组的修正

配置环境变量

tar -zxvf jdk包 -C /usr/java

chown -R root:root /usr/java/jdk1.8.0_45/

vim /etc/profile

#env环境变量

export JAVA_HOME=/usr/java/jdk1.8.0_45

export PATH=$JAVA_HOME/bin:$PATH

source /etc/profile

java -version检查

5.MySQL离线部署

https://github.com/Hackeruncle/MySQL/blob/master/MySQL%205.7.11%20Install.txt

6.准备mysql相关jar包

mkdir -p /usr/share/java

cp mysql-connector-java-5.1.47.jar /usr/share/java/mysql-connector-java.jar

jar包的名称必定要把版本号去掉,不然将不会识别

image.png

cmf

amon

都要部署在hadoop001节点上 那么此节点就要部署jar包

7.离线部署CM

解压

tar -zxvf cloudera-manager-centos7-cm5.16.1_x86_64.tar.gz -C /opt/cloudera-manager/

agent配置 (所有机器)

cd /opt/cloudera-manager/cm-5.16.1/etc/cloudera-scm-agent

vim config.inc 将server_host修改为主节点的域名

image.png

server配置(主节点)

选取hadoop001做为server端,修改server端配置文件

cd /opt/cloudera-manager/cm-5.16.1/etc/cloudera-scm-server

vim db.properties

# Copyright (c) 2012 Cloudera, Inc. All rights reserved.

#

# This file describes the database connection.

#

# The database type

# Currently 'mysql', 'postgresql' and 'oracle' are valid databases.

com.cloudera.cmf.db.type=mysql

# The database host

# If a non standard port is needed, use 'hostname:port'

com.cloudera.cmf.db.host=hadoop001

# The database name

com.cloudera.cmf.db.name=cmf

# The database user

com.cloudera.cmf.db.user=cmf

# The database user's password

com.cloudera.cmf.db.password=mysql的密码

# The db setup type

# By default, it is set to INIT

# If scm-server uses Embedded DB then it is set to EMBEDDED

# If scm-server uses External DB then it is set to EXTERNAL

com.cloudera.cmf.db.setupType=EXTERNAL

三台机器建立为cdh运行的用户,用户不须要独立的根目录以及登陆,这个用户只是给cdh作启动使用

useradd --system --home=/opt/cloudera-manager/cm-5.16.1/run/cloudera-scm-server/ --no-create-home --shell=/bin/false cloudera-scm

修改三台机器目录权限

chown -R cloudera-scm:cloudera-scm /opt/cloudera-manager

8.parcel文件离线源 hadoop001

mkdir -p /opt/cloudera/parcel-repo

mv CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel /opt/cloudera/parcel-repo/

mv CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel.sha1 /opt/cloudera/parcel-repo/CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel.sha (注意须要给文件重命名 去掉1)

mv manifest.json /opt/cloudera/parcel-repo/

校验文件是否有问题:/usr/bin/sha1sum CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel

对比返回的值 和 CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel.sha 的值是否一致

image.png

更改用户组:

chown -R cloudera-scm:cloudera-scm /opt/cloudera

这样 hadoop001的离线源部署完成

9.全部节点建立大数据软件的安装目录 用户和用户组

[root@hadoop001 parcel-repo]# mkdir -p /opt/cloudera/parcels

[root@hadoop001 parcel-repo]# chown -R cloudera-scm:cloudera-scm /opt/cloudera

10.启动服务

hadoop001启动server:

/opt/cloudera-manager/cm-5.16.1/etc/init.d/cloudera-scm-server start --启动server端

cd /opt/cloudera-manager/cm-5.16.1/log/cloudera-scm-server 进入server端日志,查看日志文件

全部服务器,启动scm:

/opt/cloudera-manager/cm-5.16.1/etc/init.d/cloudera-scm-agent start

11.打开防火墙,开启7180端口

默认用户名:admin

默认密码:admin

image1.png

选择免费版本便可

image2.png

相关文章
相关标签/搜索