Hadoop项目结构

本文来自于厦门大门-林子雨老师的讲堂及添加个人学习中的理解,做个笔录,如有BUG,请留言,不胜感激。     HDFS: 分步式文件系统,负责整个分布式文件的存储,怎么用成百上千台服务器进行数据的存储   YARN: 负责调度内存、CPU、带宽等计算资源。   MapReduce: 专门做离线计算和批处理,不做实时计算   Tez: 把MapReduce的作业进行分析优化,并构成一个有向无环图,保
相关文章
相关标签/搜索