spark面试问题汇总(持续更新....)

spark-submit的时候如何引入外部jar包 spark shuffle的具体过程,你知道几种shuffle方式 spark 如何防止内存溢出 cache和pesist的区别 怎么处理数据倾斜 ​简要描述Spark分布式集群搭建的步骤web spark使用: 1)当前文件a.text的格式为,请统计每一个单词出现的个数、计算第四列每一个元素出现的个数 A,b,c,d B,b,f,e A,a,
相关文章
相关标签/搜索