SparkStreaming并行度的计算方式和设置（spark官方文档介绍）

时间 2021-01-13

标签 spark 栏目 Spark 繁體版

原文原文链接

这是官网上的截图：通过网络（例如Kafka，Flume，套接字等）接收数据需要对数据进行反序列化并将其存储在Spark中。如果数据接收成为系统的瓶颈，请考虑并行化数据接收。请注意，每个输入DStream都会创建一个接收器（在工作计算机上运行），该接收器接收单个数据流。因此，可以通过创建多个输入DStream并将其配置为从源接收数据流的不同分区来实现接收多个数据流。例如，可以将接收两个主题数据的单

>>阅读原文<<