Spark Streaming原理与架构

简介:Spark Streaming 是基于spark的流式批处理引擎,其基本原理是把输入数据以某一时间间隔批量的处理,当批处理间隔缩短到秒级时,即可以用于处理实时数据流。web 计算流程:架构 将流试计算分解成一系列短小的批处理做业,批处理引擎是SparkCore 按照输入数据的batch size(如1秒),将数据分解成一段一段转换成RDD Spark Streaming中对DStream的T
相关文章
相关标签/搜索