Impala性能调优最佳实践

Impala性能调优最佳实践概览 1选择合适的文件格式 一般对于大数据集而言(每一个分区或者表的大小为几个G或者更大),推荐使用Parquet文件格式。由于它按列存储,单词IO能够请求更多的数据,另外它支持更好的压缩算法对二进制文件进行压缩。算法 对于小表而言(每一个分区或者表的大小小于几个G或者更小),不一样的存储格式之间没有明显的性能差异。在小数据量时,能够经过减小并行执行的机会(使用压缩文件
相关文章
相关标签/搜索