一文读懂 Spark 和 Spark Streaming

前言 Apache Spark 是当今最流行的开源大数据处理框架。和人们耳熟能详的 MapReduce 一样,Spark 用于进行分布式、大规模的数据处理,但 Spark 作为 MapReduce 的接任者,提供了更高级的编程接口、更高的性能。除此之外,Spark 不仅能进行常规的批处理计算,还提供了流式计算支持。 Apache Spark 诞生于大名鼎鼎的 AMPLab(这里还诞生过 Mesos
相关文章
相关标签/搜索