面试最新整理常问Spark知识点

问题导读: 1. RDD有哪些特性? 2. Map和MapPartitions有哪些区别? 3. 为什么Spark Application在没有获得足够的资源,job就开始执行了,可能会导致什么什么问题发生? RDD的五个特性: 1.A list of partitions RDD是一个由多个partition(某个节点里的某一片连续的数据)组成的的list;将数据加载为RDD时,一般会遵循数据的
相关文章
相关标签/搜索