原文连接:Java 核心知识整理收集 :a870439570.github.io/interview-d…html
Apache Storm是一个分布式实时大数据处理系统。Storm设计用于在容错和水平可扩展方法中处理大量数据。它是一个流数据框架,具备最高的摄取率。虽然Storm是无状态的,它经过Apache ZooKeeper管理分布式环境和集群状态。它很简单,您能够并行地对实时数据执行各类操做。git
拓扑(Topologies)这里写连接内容 流(Streams) 数据源(Spouts 数据流处理组件(Bolts) 数据流分组(Stream groupings) 可靠性(Reliability) 任务(Tasks) 工做进程(Workers)github
Tuple数据库
Streamapache
Spouts编程
Bolts安全
一个工做的Storm集群应该有一个Nimbus和一个或多个supervisors。另外一个重要的节点是Apache ZooKeeper,它将用于nimbus和supervisors之间的协调。bash
如今让咱们仔细看看Apache Storm的工做流程 −网络
默认状况下,Storm集群中有两种模式:数据结构
www.apache.org/dyn/closer.… 下载解压,编辑conf/storm.yaml文件
##填写zookeeper集群的ip地址或者主机名
########### These MUST be filled in for a storm configuration
storm.zookeeper.servers:
- "192.168.2.149"
- "192.168.2.150"
- "192.168.2.151"
nimbus.seeds: ["192.168.2.149"]
#配置数据存储路径
storm.local.dir: "/data/ms/storm-1.1.1/data"
##配置节点健康检测
storm.health.check.dir: "healthchecks"
storm.health.check.timeout.ms: 5000
storm.local.hostname: "192.168.2.150"
#配置supervisor: 开启几个端口插槽,就开启几个对应的worker进程
supervisor.slots.ports:
- 6700
- 6701
- 6702
- 6703
复制代码
配置详解 xstarcd.github.io/wiki/Cloud/…
最后一步是启动全部的Storm守护进程。 在监督下运行这些守护进程是很是重要的。 Storm是一个快速失败(fail-fast)系统,意味着只要遇到意外错误,进程就会中止。 Storm的设计能够在任什么时候候安全中止,并在从新启动过程时正确恢复。 这就是为何Storm在进程中不保持状态 - 若是Nimbus或Supervisors从新启动,运行的拓扑结构不受影响。 如下是如何运行Storm守护进程:
Nimbus:在Storm主控节点上运行命令bin/storm nimbus &,启动Nimbus后台程序,并放到后台执行。
Supervisor:在Storm各个工做节点上运行命令bin/storm supervisor &。
UI: 在Storm主控节点上运行命令bin/storm ui &,启动UI后台程序,并放到后台执行
复制代码
访问http://192.168.1.191:8080 成功