SQL/HQL中数据去重的3种方式

30万条数据的去重比较web 1.distinct select distinct * from tableName hive用时: 40.47秒 impala用时: 11.98秒svg 2.group by select c1,c2,c3,c4,c5,max(c6) c6 from tableName group by c1,c2,c3,c4,c5 hive用时: 22.8秒 impala用时:
相关文章
相关标签/搜索