saprkSQL的思考及开发实战(一)

sparkSQL:数据读入到sparkSQL,进行数处理或者算法实现,然后再把处理收的数据输出到相应的输出源中,在实际开发过程中需要考虑如下几个点: 1、数据源多少,sparkSql支持多种数据源hive\json\.txt\orc文件\jdbc; 2、字段的映射关系与语言的定义类型相关 3、数据拥有的情况下,组织这些数据->数据结构->操作数据 sparkSQL的实战介绍 2、hiveConte
相关文章
相关标签/搜索