google mapreduce杂谈

    0 摘要   mapreduce是一个编程模型也是一个算法模型的相关实现。 这个系统运行时只关心: 如何分割数据,在大量计算机组成的集群上调度,  集群在计算机中的错误处理,  管理集群中计算机之间的必要通讯。   google集群中每天都有1000多个mapreduce程序在执行。     1 介绍    处理大量原始数据:  文档抓取, web请求日志,计算各种类型的衍生数据(倒排索引
相关文章
相关标签/搜索