学习笔记之PySpark

文章目录 一、PySpark 的背后原理 二、文档 三、pyspark读写dataframe 四、通过spark-submit提交任务模板示例 五、代码示例 1、WordCount词频分析 2、使用PySpark语言开发操作Hive 一、PySpark 的背后原理 架构图: 其中白色部分是新增的Python进程,在Driver端,通过Py4j实现在Python中调用Java的方法,即将用户写的Py
相关文章
相关标签/搜索