Spark---DataDrame学习(一)

一.结构化API–DataFrame Spark结构化API是处理各种数据类型的工具,能处理非结构化的日志文件、半结构化的csv文件、高度结构化的Parquet文件。包括以下三种核心分布式集合类型API: Dataset DataFrame SQL表和视图 DataFrame DataFrame由记录(record)组成,record是Row类型。一个record由多列组成,这里可以类比pytho
相关文章
相关标签/搜索