Spark Streaming的系统架构

传统流处理系统架构 流处理架构的分布式流处理管道执行方式是,首先用数据采集系统接收来自数据源的流数据,然后在集群上并行处理数据,最后将处理结果存放至下游系统。 为了处理这些数据,传统的流处理系统被设计为连续算子模型,其工作方式如图 1 所示。 系统包含一系列的工作结点,每组结点上运行一至多个连续算子。对于流数据,每个连续算子(ContinuousOperator)一次处理一条记录,并且将记录传输给
相关文章
相关标签/搜索