大数据技术 -- MapReduce 简介

本文为senlie原创,转载请保留此地址:http://www.cnblogs.com/senlie/ 1.概要 很多计算在概念上很直观,但由于输入数据很大,为了能在合理的时间内完成,这些计算 必须分布在数以百计数以千计的机器上。例如处理爬取得到的文档、网页请求日志来计算 各种衍生数据,如倒排索引,网页文档的各种图结构表示,从每个主机上爬取的文档数, 在某一天最频繁的查询的集合。 MapReduc
相关文章
相关标签/搜索