Spark Stream 流式处理

总结:web Spark的核心数据结构是RDD(弹性分布式数据集) Spark Streaming 采用微批处理模式,保证消息传输精准性,采用checkpoint方式保证可靠性,具备良好的吞吐性能,延时表现非真正实时 Spark Streaming 能够接收Kafka和HDFS等在内的多种数据源,批量处理后,输出到HDFS、数据库或文件系统
相关文章
相关标签/搜索