Presto查询优化

Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。查询语言是类ANSI SQL语句。笔者在多个项目中用到Presto作即席查询,总结了一些优化措施。算法 1、数据存储 合理设置分区 与Hive相似,Presto会根据元信息读取分区数据,合理的分区能减小Presto数据读取量,提高查询性能。 使用列式存储 Presto对ORC文件读取作了特定优化,所以在H
相关文章
相关标签/搜索