spark 初学(一) - 原理

 Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。 优点: Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求 Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚至能够将应用在磁盘上的运行速度提升10倍 使用情景:1  数据量大   2  计算复杂 s
相关文章
相关标签/搜索