spark读取json,parquet文件

spark支持的一些常见的格式:sql 文本文件,无任何的格式apache json文件,半结构化json parquet,一种流行的列式存储格式session sequencefile,一种用于key-value的hadoop文件格式,若是须要读hdfs数据的话,一般走hive的比较多。oop 在企业中不多用,缘由是写sql的时候,能用sparksession解决的,都不会去弄rdd的各类tra
相关文章
相关标签/搜索