大数据开发常见面试问题(重要...)

一、简述对大数据组件的理解? Yarn:大数据组件运行的job的管理器 Spark:分布式的利用内存进行分布式运算的大数据组件 Hbase:基于Hadoop的大数据经常使用数据库 Hive:基于Hadoop的大数据数据仓库,操做和关系型数据库(MySQL)相似 二、hdfs文件系统中NameNode和DataNode的区别和联系? NameNode存储了元数据,而且调度,协调整个集群mysql D
相关文章
相关标签/搜索