整理对Spark SQL的理解

http://blog.csdn.net/pelick/article/details/22723699 Catalyst是与Spark解耦的一个独立库,是一个impl-free的执行计划的生成和优化框架。 目前与Spark Core还是耦合的,对此user邮件组里有人对此提出疑问,见mail。   以下是Catalyst较早时候的架构图,展示的是代码结构和处理流程。 Catalyst定位 其他系
相关文章
相关标签/搜索