Storm集群搭建

Storm集群搭建

1、Storm集群搭建

    准备三台服务器,角色分配以下:java

    yun01:Zookeeper、nimbus。web

    yun02:Zookeeper、supervisor。后端

    yun03:Zookeeper、supervisor。bash

一、安装JDK

服务器

二、安装zookeeper集群

    参见: Zookeeper集群的搭建ui

三、安装Storm

    解压安装包便可spa

四、配置Storm

1.storm.yaml

    修改$STORM_HOME/conf目录下的storm.yaml文件。.net

1>必须修改的项

    storm.zookeeper.services:命令行

    配置zookeeper集群的主机名称。code

    nimbus.host:

    指定了集群中nimbus的节点。

    supervisor.slots.ports:

    配置控制每一个supervisor节点运行多少个worker进程。这个配置定义为worker监听的端口的列表,监听端口的个数控制了supervisor节点上有多少个worker的插槽。默认的storm使用6700~6703端口,每一个supervisor节点上有4个worker插槽。

    storm.local.dir:

    storm工做时产生的工做文件存放的位置,注意,要避免配置到/tmp下。

    配置样式以下:

#Zookeeper集群的ip地址或者主机名
storm.zookeeper.services:
   - "yun01"
   - "yun02"
   - "yun03"
#主节点的ip或者主机名
nimbus.host: "yun01"
#个节点的工做端口
supervisor.slots.ports:
   - 6700
   - 6701
   - 6702
   - 6703
#产生文件存储位置
storm.local.dir: "/home/software/storm/tmp"

    注意:每行主要语句开始的时候不要有空格,不然会有意想不到的错误发生。

2>可选的经常使用修改项

    nimbus.childopts(default: -Xms1024m):

    这项JVM配置会添加在启动nimbs守护进程的java命令行中。

    ui.port(default:8080):

    这项配置指定了Storm UI的Web服务器监听的端口。

    ui.childopts(default:-Xms1024m):

    这项JVM配置会添加在StormUI服务启动的Java命令行中。

    supervisor.childopts(default:-Xms768m):

    这项JVM配置会添加Supervisor服务启动的Java命令行中。

    worker.childopts(default:-Xms768m):

    这项JVM配置会添加worker服务启动的Java命令行中。

    topology.message.timeout.secs(default:30):

    这个配置项定义了一个tuple树须要应答最大时间秒数限制,超过这个时间则认为超时失败。

    topology.max.spout.pending(default:null):

    在默认值null的状况下,spout每当产生新的tuple时会当即向后端发送,因为下游bolt执行可能具备延迟,可能致使topology过载,从而致使消息处理超时。若是手动将该值改成非null正整数时,会经过暂停spout发送数据来限制同时处理的tuple不能超过这个数,从而达到为Spout限速的做用。

    topology.enable.message.timeouts(default:true):

    这个选项用来锚定的tuple的超时时间。若是设置为false,则锚定的tuple不会超时。

五、Storm命令

1.启动命令

    在启动storm以前确保storm使用的zookeeper已经启动且可使用。

storm nimbus

    启动nimbus守护进程。

storm supervisor

    启动supervisor守护进程。

storm ui

    启动stormui的守护进程,从而能够经过webUI界面来监控storm运行过程。

storm drpc

    启动一个DRPC服务守护进程。

2.管理命令

storm jar topology_jar topology_class[arguments...]

    向集群提交topology。它会使用指定的参数运行topology_class中的main()方法,同时上传topology_jar文件到nimbus以分发到整个集群。提交后,Storm集群会激活而且开始运行topology。topology中的main()方法须要调用StormSubmitter.submitTopology()方法,而且为topology提供集群内惟一的名称。

storm kill topology_name[-w wait_time]

    用来关闭已经部署的topology。

storm deactivate topology_name

    中止指定topology的spout发送tuple

storm activate topology_name

    恢复指定topology的spout发送tuple。

storm rebalance topology_name[-w wait_time][-n worker_count][-e component_name=executor_count]

    指定storm在集群的worker之间从新平均地分配任务,不须要关闭或者从新提交现有的topology。当执行rebalance命令时,Storm会先取消激活topology,等待配置的的时间使剩余的tuple处理完成,而后再supervisor节点中均匀的从新分配worker。从新分配后,Storm会将topology恢复到以前的激活状态。

storm remoteconfvalue conf-name

    用来查看远程集群中的配置参数值。

六、把topology提交到集群中

    案例:改造以前的单词计数案例,将其在集群中运行。

    修改提交topology的代码:

StormSubmitter.submitTopology("mywc", conf, topology);

    将程序打成jar包,同时设置jar包的主类,将jar包上传到集群中。

    经过命令执行jar包:

storm jar /root/work/stormwc.jar cn.tedu.storm.wc.WordCountTopology

    执行一段时间后,能够经过若是下命令关闭topology

storm kill mywc

 

个人博客即将搬运同步至腾讯云+社区,邀请你们一同入驻:

https://cloud.tencent.com/developer/support-plan

相关文章
相关标签/搜索