Storm 和JStorm

时间 2019-11-12

标签 storm jstorm 栏目 Storm 繁體版

原文原文链接

关于流处理框架，在先前的文章汇总已经介绍过Strom，今天学习的是来自阿里的的流处理框架JStorm。简单的概述Storm就是：JStorm 比Storm更稳定，更强大，更快，Storm上跑的程序，一行代码不变能够运行在JStorm上。直白的将JStorm是阿里巴巴的团队基于Storm的二次开发产物，至关于他们的Tengine是基于Ngix开发的同样。html

阿里拥有本身的实时计算引擎框架

相似于hadoop 中的MR运维
开源storm响应太慢异步
开源社区的速度彻底跟不上Ali的需求oop
下降将来运维成本性能
提供更多技术支持，加快内部业务响应速度学习

现有Storm没法知足一些需求优化

现有storm调度太简单粗暴，没法定制化spa
Storm 任务分配不平衡线程
RPC OOM一直没有解决
监控太简单
对ZK 访问频繁

JStorm相比Storm更稳定

Nimbus 实现HA：当一台nimbus挂了，自动热切到备份nimbus
原生Storm RPC：Zeromq 使用堆外内存，致使OS 内存不够，Netty 致使OOM；JStorm底层RPC 采用netty + disruptor保证发送速度和接受速度是匹配的
新上线的任务不会冲击老的任务：新调度从cpu，memory，disk，net 四个角度对任务进行分配，已经分配好的新任务，无需去抢占老任务的cpu，memory，disk和net
Supervisor主线
Spout/Bolt 的open/prepar
全部IO, 序列化，反序列化
减小对ZK的访问量：去掉大量无用的watch；task的心跳时间延长一倍；Task心跳检测无需全ZK扫描。

JStorm相比Storm调度更强大

完全解决了storm 任务分配不均衡问题
从4个维度进行任务分配：CPU、Memory、Disk、Net
默认一个task，一个cpu slot。当task消耗更多的cpu时，能够申请更多cpu slot
默认一个task，一个memory slot。当task须要更多内存时，能够申请更多内存slot
默认task，不申请disk slot。当task 磁盘IO较重时，能够申请disk slot
能够强制某个component的task 运行在不一样的节点上
能够强制topology运行在单独一个节点上
能够自定义任务分配，提早预定任务分配到哪台机器上，哪一个端口，多少个cpu slot，多少内存，是否申请磁盘
能够预定上一次成功运行时的任务分配，上次task分配了什么资源，此次仍是使用这些资源

JStorm相比Storm性能更好

JStorm 0.9.0 性能很是的好，使用netty时单worker 发送最大速度为11万QPS，使用zeromq时，最大速度为12万QPS。

JStorm 0.9.0 在使用Netty的状况下，比Storm 0.9.0 使用netty状况下，快10%，而且JStorm netty是稳定的而Storm 的Netty是不稳定的
在使用ZeroMQ的状况下， JStorm 0.9.0 比Storm 0.9.0 快30%

性能提高的缘由：

Zeromq 减小一次内存拷贝
增长反序列化线程
重写采样代码，大幅减小采样影响
优化ack代码
优化缓冲map性能
Java 比clojure更底层

JStorm的其余优化点

资源隔离。不一样部门，使用不一样的组名，每一个组有本身的Quato；不一样组的资源隔离；采用cgroups 硬隔离
Classloader。解决应用的类和Jstorm的类发生冲突，应用的类在本身的类空间中
Task 内部异步化。Worker 内部全流水线模式，Spout nextTuple和ack/fail运行在不一样线程

具体如何实现，请参考本ID的的博文系列【jstorm-源码解析】

1. JStorm和Storm比较
2. 阿里jstorm和storm区别
3. jstorm storm 入门demo
4. 阿里的STORM——JSTORM
5. storm/jstorm 相关命令
6. JStorm
7. [Jstorm]Jstorm章1　Jstorm架构浅析
8. Storm和JStorm(阿里的流处理框架)
9. JStorm和DRPC
10. jstorm部署《转》
更多相关文章...
• XLink 和 XPointer 语法 - XLink 和 XPointer 教程
• Kotlin 类和对象 - Kotlin 教程
• IntelliJ IDEA 代码格式化配置和快捷键
• 适用于PHP初学者的学习线路和建议