[Kafka与Spark集成系列三] Spark编程模型

时间 2019-12-07

标签 kafka spark 集成系列编程模型栏目 Kafka 繁體版

原文原文链接

欢迎支持笔者新做：《深刻理解Kafka:核心设计与实践原理》和《RabbitMQ实战指南》，同时欢迎关注笔者的微信公众号：朱小厮的博客。 java 在Spark中，咱们经过对分布式数据集的操做来表达咱们的计算意图，这些计算会自动地在集群上并行进行。这样的数据集被称为弹性分布式数据集（Resilient Distributed Dataset），简称RDD。RDD是Spark对分布式数据和计算的基本

>>阅读原文<<