Spark Streaming(二十四)初识SparkStreaming

定义 SparkStreaming是Spark核心API的扩展,类似与Apache Storm,但是它不是真正的是实时的,它是准实时的,也就是单位时间内做小批量的处理,它是可伸缩的、高可用的、容错的、用来处理流式数据的。它能够从Kafka、Flume、Kinesis、TCP socket中加载数据,加载进来的数据可以用map、reduce、join、window等抽象函数进行处理,最后处理的结果数
相关文章
相关标签/搜索