Spark Streaming算子篇详解

Spark Streaming是核心Spark API的扩展,它支持对实时数据流进行可伸缩、高吞吐量和容错的流处理。数据能够从Kafka、Flume、Kinesis或TCP套接字等多个源获取,也可使用map、reduce、join和window等高级函数表示的复杂算法进行处理。最后,能够将处理过的数据推送到文件系统、数据库和实时仪表板。事实上,您能够将Spark的机器学习和图形处理算法应用于数据流
相关文章
相关标签/搜索