Hadoop学习笔记————MapReduce

简介 MapReduce是一种编程模型,并且是处理和生成大数据集的相关实现。用户指定一个map函数去处理key/value对,生成一个包含新的key/value对的集合(中间数据);reduce函数合并具有相同key值的中间数据。用户的程序按照这个模式编写,并且在一个集群上运行,这是利用分布式的一个典型的『并行』思想。用户无需关注输入文件的分割、任务在集群上的调度、集群内部的通信以及机器运行的失败
相关文章
相关标签/搜索