大数据入门(一)

大数据入门 hadoop HDFS YARN SPARK hadoop hadoop生态圈包括以下各个组成部分:  HDFS:用于分布式文件存储,切分成块,多副本存于多台机器。  YARN:用于资源管理和调度,job scheduling & cluster mangment  Zookeeper:各个框架的管理和协调  Hive:使系统支持SQL语句  ooize:工作流  pig:使用脚本sc
相关文章
相关标签/搜索