Structured Streaming:从入门到精通(一)[ 曲折发展史]

Spark Streaming Spark Streaming针对实时数据流,提供了一套可扩展、高吞吐、可容错的流式计算模型。Spark Streaming接收实时数据源的数据,切分成很多小的batches,然后被Spark Engine执行,产出同样由很多小的batchs组成的结果流。本质上,这是一种micro-batch(微批处理)的方式处理 不足在于处理延时较高(无法优化到秒以下的数量级),
相关文章
相关标签/搜索