Hadoop生态系统

Hadoop生态系统 狭义的Hadoop Hadoop的三大核心组件 HDFS, MapReduce,YARN 广义的Hadoop ​ HDFS:文件存储系统基于硬盘 ​ YARN:资源调度框架 ​ MapReduce:分布式处理框架 ​ Hive:数据仓库 ​ RConnections:数据分析 ​ Mahout:机器学习库 ​ pig:脚本语言,跟Hive类似 ​ Oozie:工作流引擎,管理
相关文章
相关标签/搜索