spark ORC原理

orc历史   ORC的全称是(Optimized Row Columnar),ORC文件格式是一种Hadoop生态圈中的列式存储格式,它的产生早在2013年初,最初产生自Apache Hive,用于下降Hadoop数据存储空间和加速Hive查询速度。java orc结构–----hdfs上的物理视图    orc结构----逻辑视图 orc存储结构解析     orc文件有以下结构快:block
相关文章
相关标签/搜索