Spark(39) -- SparkStreaming -- 流式应用状态

流式应用状态 使用SparkStreaming处理实际实时应用业务时,针对不同业务需求,需要使用不同的函数。SparkStreaming流式计算框架,针对具体业务主要分为三类,使用不同函数进行处理: 业务一:无状态Stateless 使用transform和foreacRDD函数 比如实时增量数据ETL:实时从Kafka Topic中获取数据,经过初步转换操作,存储到ES或HBase表中。 业务二
相关文章
相关标签/搜索