pyspark streaming简介 和 消费 kafka示例

简介 并不是真正的实时处理框架,只是按照时间进行微批处理进行,时间可以设置的尽可能的小。 将不同的额数据源的数据经过SparkStreaming 处理之后将结果输出到外部文件系统 特点 低延时 能从错误中搞笑的恢复: fault-tolerant 能够运行在成百上千的节点 能够将批处理、机器学习、图计算等自框架和Spark Streaming 综合起来使用 粗粒度 Spark Streaming接
相关文章
相关标签/搜索