Spark Streaming

Spark Streaming 是一个批处理的流式计算框架。它的核心是Spark,适合处理实时数据与历史数据混合处理的场景,并保证容错性。 Spark Streaming是构建在Spark上的实时计算框架,扩展了Spark流式大数据处理能力。它将数据流以时间片单位进行分割形成RDD,使用RDD操作处理每一块数据,每块数据(RDD)都会生成一个Spark Job进行处理,最终的表现形式就是以批处理的
相关文章
相关标签/搜索