HQL底层原理及优化:(一)使用group by代替distinct,以防数据倾斜。

本文转载自hive性能优化使用group by替代distinct原理-weixin_42412645,感谢做者的知识分享,文章已讲解得很是清晰,笔者再也不赘述。web 平常业务统计中常常使用除重(distinct)操做,可是当出现某一组数据特别多时就会出现数据倾斜。因而在SQL编写的时候就使用group by来代替distinct,从而让执行效率提高。下面说一下我的的理解。 原始数据page_t
相关文章
相关标签/搜索