2020-09-11:Hive的优化策略有哪些?

福哥答案2020-09-11:web Hive调优及优化的12种方式 1.请慎重使用COUNT(DISTINCT col)。能够考虑使用Group By 或者 ROW_NUMBER() OVER(PARTITION BY col)方式代替COUNT(DISTINCT col)。 2.小文件会形成资源的多度占用以及影响查询效率。在数据源头HDFS中控制小文件产生的个数。 3.请慎重使用SELECT
相关文章
相关标签/搜索