Spark core 核心算子优化

算子优化 MapPartitions spark中,最基本的原则,就是每一个task处理一个RDD的partition。 MapPartitions操做的优势: 若是是普通的map,好比一个partition中有1万条数据;ok,那么你的function要执行和计算1万次。 可是,使用MapPartitions操做以后,一个task仅仅会执行一次function,function一次接收全部的pa
相关文章
相关标签/搜索