大数据面试题整理汇总(持续更新ING)

目录 Hadoop 1. 下列哪项一般是集群的最主要瓶颈 2. 请列出正常工做的Hadoop集群中Hadoop都分别须要启动哪些进程,它们的做用分别是什么? 3. HDFS读写流程 Spark 1. 对于Spark存在的数据倾斜问题你有什么好的解决方法吗? 2. 简述你所理解的 Spark 的 shuffle 过程 3. Spark中的算子分为哪两类? Hive 1. 谈一下hive的特色,以及h
相关文章
相关标签/搜索