Spark Streaming与Kafka集成编程

Spark Streaming是运行在Spark引擎之上实时处理工具,提供可扩展、高吞吐量、具备容错能力实时数据流处理功能,经过把接收的数据流里的数据分隔到一系列的批次,而后由Spark引擎处理生成结果 html Spark Streaming提供了高级别的抽象DStream用来表示连续的数据流,DStream其实就是RDDs的序列:java Spark Streaming与Kafka集成由于Ka
相关文章
相关标签/搜索