大数据--MapReduce学习笔记

一、MapReduce简介 MapReduce:2004年 Google paper中提出。 一个用于分布式数据处理的编程模型和运行环境。适合处理各种结构化和非结构化的数据。 HDFS(hadoop 分布式文件系统)是MapReduce的基础。 分布式系统的设计原则 moving computation is more cheaper than moving data。(现场办公) Map 示例:
相关文章
相关标签/搜索