【大数据面试题】(五)Spark 相关面试题总结

文章目录 1、spark中的RDD是什么,有哪些特性? 2、概述一下spark中的经常使用算子区别(map,mapPartitions,foreach,foreachPatition)? 3、谈谈spark中的宽窄依赖? 4、spark中如何划分stage? 5、RDD缓存? 6、driver 的功能是什么? 7、Spark master 使用zookeeper 进行HA 的,有哪些元数据保存在Z
相关文章
相关标签/搜索