1、在Docker容器中运行Hadoop集群git
3个节点的hadoop集群搭建github
[AppleScript] 纯文本查看 复制代码
?
1
sudo docker pull kiwenlau/hadoop:1.0docker
[AppleScript] 纯文本查看 复制代码
?
1
git clone [url=https://github.com/kiwenlau/h...]https://github.com/kiwenlau/hadoop-cluster-docker[/url]oop
[AppleScript] 纯文本查看 复制代码
?
1
sudo docker network create --driver=bridge hadoopui
[AppleScript] 纯文本查看 复制代码
?
1
2
cd hadoop-cluster-docker
sudo ./start-container.shurl
输出:ip
start hadoop-master container...
start hadoop-slave1 container...hadoop
start hadoop-slave2 container...get
root@hadoop-master:~#input
启动3个容器,包含1个主节点和2个从节点
你将进入hadoop-master容器的/ root目录
[AppleScript] 纯文本查看 复制代码
?
1
./start-hadoop.sh
[AppleScript] 纯文本查看 复制代码
?
1
./run-wordcount.sh
输出
input file1.txt:
Hello Hadoop
input file2.txt:
Hello Docker
wordcount output:
Docker 1
Hadoop 1
Hello 2
二、任意大小的Hadoop集群
2.1. rebuild docker image
[AppleScript] 纯文本查看 复制代码
?
1
sudo ./resize-cluster.sh 5
指定参数> 1:2,3 ..
这个脚本只是使用不一样的从属文件重建hadoop映像,这样能够强制全部从属节点的名称
2.1. start container[AppleScript] 纯文本查看 复制代码?1sudo ./start-container.sh 5