数据计算(大数据):MapReduce、Spark、Storm概述、特色、原理

MapReduce MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数:Map和Reduce。算法 特色:编程容易;分而治之策略(大规模数据集,会被切成许多独立分片,分片由多个Map任务);计算向数据靠拢(设计理念)编程 函数架构 输入框架 输出机器学习 说明函数 Mapoop <k1,v1>如:学习 <行号,”a b c”>大数据 List(<k2,v2>)spa
相关文章
相关标签/搜索