使用pyspark执行hive sql

文章目录 配置环境 执行模式 hive模式 pyspark模式 最终结果 hive模式 pyspark模式 错误解决 错误一:字节编码 错误二:传递参数 后续 参考文章 配置环境 环境配置这里就不再多讲,只研究执行效率的对比 spark hadoop 执行模式 假设一个查询host出数量的sql是这样: select host,count(distinct c.mobile) as mobile_
相关文章
相关标签/搜索