HaLoop:大集群上高效的迭代数据处理(上)

摘要:超大规模数据挖掘和数据分析需求的日益增加,引领着工业和学术界设计大数据计算平台新模式。MapReduce和Dryad是两种流行的平台,数据流在这两种平台上采用操做符的有向非循环图形式。迭代程序在数据挖掘、网页排名、图像分析、模型拟合等许多应用领域中天然而然地出现了,而这两种平台缺少对迭代程序的内嵌支持。在这篇文章中会呈现HaLoop,这是一种改进的用来服务于各类应用的Hadoop MapRe
相关文章
相关标签/搜索