spark从入门到放弃三十一:Spark Sql (4)数据源Parquet

文章地址:http://www.haha174.top/article/details/253452 项目源码:https://github.com/haha174/spark.git 1.简介 parquet 是面向分析型业务的列示存储格式. 列式存储比行式存储有哪些优点呢 1.能够跳过不符合条件的数据,只读取须要的数据,下降IO的数量。 2.压缩编码格式能够下降磁盘空间。因为同一列的数据类型是
相关文章
相关标签/搜索