大数据------搭建数据仓库过程及Yarn调度MR任务

  搭建数据仓库过程    Yarn调度MR任务   MapReduce 应用:wordCount、倒排索引、网站排名、推荐共同好友等 MapReduce 编程模型底层基于Java开发 MapReduce分为Map阶段拆分,Reduce阶段合并。      1.任务:主任务(job)=Map(拆分)+Reduce(合并)      2.处理数据来源来自于HDFS(分布式文件存储系统),结果同样存储
相关文章
相关标签/搜索