spark集群计算

摘要:        MapReduce以及其的各种变种,在商业集群上进行的对大规模密集型数据集的应用上已经取得了很大的成功。然而大多数这类系统都是围绕着一个非迭代型的数据流模型,这种模型不适用于目前很多主流的应用程序。本文的研究侧重于介绍其中这样一类应用:重复使用跨多个并行操作的数据的工作流集合。这一类应用,包括了各种机器学习算法以及交互性数据分析工具。我们提出了一个名为“spark”的新框架,
相关文章
相关标签/搜索