Learning Spark 学习笔记 第五章 加载或保存数据

大体分为三种数据源:数据库 1.文件和文件系统编程 本地或者分布式文件系统的文件,能够为text,json,sequenceFile和协议缓存格式的文件数据。json 2.结构化数据(Spark SQL)缓存 第九章会详细讲述app 3.数据库和键值存储编程语言 文件格式:分布式 支持的常见文件格式为:spa 文本文件:scala 文本文件在spark中加载和保存很简单,加载一个文本文件为一个RD
相关文章
相关标签/搜索