前言 Hadoop / Spark / MapReduce 介绍

一、MapReduce MapReduce是一种软件框架,可以采用并行、分布式方式处理GB、TB甚至PB级的大数据集,同时他也是在商用服务器集群上完成大规模数据处理的执行框架。实现MapReduce的方法有很多,本书主要关注Apache Spark 和 MapReduce/Hadoop两种实现方法。 MapReduce是一种编程范式,可以利用集群环境的成百上千台服务器实现强大的可伸缩性(在这里,我
相关文章
相关标签/搜索