关于流式计算:Flink与Spark Streaming谁的拳头更硬

前言 流数据(或数据流)是指在时间分布和数量上无限的一系列动态数据集合体,数据的价值随着时间的流逝而降低,因此必须实时计算给出秒级响应。流式计算,顾名思义,就是对数据流进行处理,是实时计算。 架构对比 生态           运行模型 Spark Streaming 是微批处理,运行的时候需要指定批处理的时间,每次运行 job 时处理一个批次的数据 Flink 是基于事件驱动的,事件可以理解为消
相关文章
相关标签/搜索