spark Streaming的Receiver和Direct的优化对比

 Direct 1、简化并行读取:如果要读取多个partition,不需要创建多个输入DStream然后对它们进行union操作。Spark会创建跟Kafka partition一样多的RDD partition,并且会并行从Kafka中读取数据。所以在Kafka partition和RDD partition之间,有一个一对一的映射关系。 2、高性能:如果要保证零数据丢失,在基于receiver
相关文章
相关标签/搜索