7-hive优化

1:按需取数 正确脚本: select id from t_tab; 错误脚本: select * from t_tab; 所以查询数据如果只需要一两个字段,尽量不要用*,如果表为parquet列式存储,能很好的体现性能。   2:在获取含分区的大表数据时,当使用关联时,如果将副表的过滤条件写在Where后面,那么就会先全表关联,之后再过滤 select a.* from t_tab_a a jo
相关文章
相关标签/搜索