[大数据] Spark架构详解

Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其余大数据和MapReduce技术相比,Spark有以下优点:html Spark提供了一个全面、统一的框架用于管理各类有着不一样性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的
相关文章
相关标签/搜索