Spark 原理与实践

Spark 系统是分布式批处理系统和分析挖掘引擎 ; AMP LAB 贡献到 Apache 社区的开源项目,是 AMP 大数据栈的基础组件;做什么 数据处理( Data Processing ):可以用来快速处理数据,兼具容错性和可扩展性。迭代计算( Iterative Computation ):支持迭代计算,有效应对多步的数据处理逻辑。 数据挖掘 ( Data Mining ):在海量数据基础
相关文章
相关标签/搜索