Apache storm 是一个开源集群计算系统。Storm让处理大量的数据流变得简单可靠,就像那些运行在Hadoop 批处理上的实时计算同样。Storm很简单,能够被任何编程语言使用,并且过程很是轻松愉快。html
Storm能够用在不少场景:实时分析,在线机器学习,连续计算,分布式RPC,ETL等等。Storm很是快速,每秒有超过百万次的元组(tuples)操做运行在任一节点(node)上。他是可量化(scalable),容错的,确保全部数据能够被处理,并且很是简单部署和操做。node
Storm结合了你已经在使用的队列(queue)和数据库技术。一个storm topology消费数据流并用任意复杂的方式去处理这些数据,而且能够在计算的任意阶段(stage)从新分配这些数据流,详细内容在 指导(the tutorial)数据库