大数据(Hadoop)-MapReduce

MapReduce计算模型是大数据处理模式的鼻祖,这种模型很容易实现数据处理对并行化,并且编程模型简单,但对于复杂的运算逻辑往往需要大量的代码。 MapReduce任务涉及到的组件 在hadoop1.x中,MapReduce的运行依赖于JobTracker和TaskTracker,但在最新的hadoop版本中,以及被yarn替代,涉及到的主要组件有: 1)ResourceManager:负责整集群
相关文章
相关标签/搜索