一文读懂 Spark 和 Spark Streaming

前言数据库 Apache Spark 是当今最流行的开源大数据处理框架。和人们耳熟能详的 MapReduce 同样,Spark 用于进行分布式、大规模的数据处理,但 Spark 做为 MapReduce 的接任者,提供了更高级的编程接口、更高的性能。除此以外,Spark 不只能进行常规的批处理计算,还提供了流式计算支持。编程 Apache Spark 诞生于大名鼎鼎的 AMPLab(这里还诞生过
相关文章
相关标签/搜索