Spark(29) -- SparkSQL底层如何执行

1. RDD 和 SparkSQL 运行时的区别 RDD 的运行流程 大致运行步骤 先将 RDD 解析为由 Stage 组成的 DAG, 后将 Stage 转为 Task 直接运行 问题 任务会按照代码所示运行, 依赖开发者的优化, 开发者的会在很大程度上影响运行效率 解决办法 创建一个组件, 帮助开发者修改和优化代码, 但这在 RDD 上是无法实现的 为什么 RDD 无法自我优化? RDD 没有
相关文章
相关标签/搜索