Spark详解(十二):Spark Streaming原理和实现

1 简介 SparkStreaming是Spark核心API的一个扩展,具有高吞吐量和容错能力的实时流数据处理系统,可以对多种数据源(如Kdfka、Flume、Twitter、Zero和TCP 套接字)进行类似Map、Reduce和Join等复杂操作,并将结果保存到外部文件系统、数据库或应用到实时仪表盘。 Spark Streaming在内部处理的机制原理是:先接受实时流的数据,并根据一定的时间间
相关文章
相关标签/搜索