sparkStreaming读取kafka的两种方式

第一个是:Receiver-base 基于Receiver的kafka数据消费模式就是先把数据从kafka中读取出来而后缓存到内存而后再定时处理。这里要引入一个参数配置 spark.streaming.receiver.writeAheadLog.enable 防止集群闪退偏移量没作好形成数据丢失。 Receiver-basede kafka读取模式是基于Kafka的高阶(high-level)a
相关文章
相关标签/搜索