kafka与SparkStreaming整合

时间 2020-12-27

标签 Saprk SparkStreaming kafka 大数据操作系统 spark 栏目 Kafka 繁體版

原文原文链接

1、Receiver模式接收器模式，必须有一个Task接收数据接收器模式的话很容易造成丢失数据。如果接收数据的期间，Driver挂掉，那么在Excuter内存中的数据多多少少会丢失一些， WAL机制优化机制，可以将数据存储在Hdfs一份，但一定要设置Checkpoint 持久化才可以放磁盘不tm开启放个屁。 1.6之后这种模式就被移除了 Direct模式处理数据就去拿，而不是被动的接收数

>>阅读原文<<