Spark四大组件包括Spark Streaming、Spark SQL、Spark MLlib和Spark GraphX。

Spark四大组件包括Spark Streaming、Spark SQL、Spark MLlib和Spark GraphX。它们的主要应用场景是: Spark Streaming: Spark Streaming基于微批量方式的计算和处理,能够用于处理实时的流数据。它使用DStream,简单来讲就是一个弹性分布式数据集(RDD)系列,处理实时数据。 Spark SQL: Spark SQL能够经过
相关文章
相关标签/搜索