Spark 01 概述

1)介绍 Apache Spark™ is a unified analytics engine for large-scale data processing. 快速通用的处理大规模数据的引擎。 2)产生背景 MapReduce局限性 1)代码繁琐 2)只能够支持map和reduce方法 3)执行效率低下 4)不适合迭代多次、交互式、流式的处理 框架多样化 1)批处理(离线):MapReduce
相关文章
相关标签/搜索