Hadoop基础知识:关于MapReduce

一、定义:是一种用于数据处理的编程模型,本质上是并行运行的,优点在于大规模处理数据集编程 MapReduce分为map函数和reduce函数函数         一、map该函数输入的是原始数据(文本格式便可),键值是某一行的起始位置对于文件的起始位置的偏移量,map只是一个数据的准备阶段,经过这种方式准备数据,是的reduce可以继续对数据处理map         二、对map函数的数据处理,
相关文章
相关标签/搜索