PySpark学习笔记(1)

最近工做有须要用到PySpark,而本身对这方面还不太熟悉。有鉴于此,颇有必要系统性的梳理下PySpark的基本语法和特性,以供之后参考。python 1.Spark简介 Apache Spark是一个开源、强大的的分布式查询和处理引擎,最初由Matei Zaharia在UC Berkeley读博期间开发的[1]。最先的Spark版本于2012年发布,后来被捐赠给Apache SoftwareFo
相关文章
相关标签/搜索