hive去重统计

hive去重多行数据并统计 这个是练习数据部分截图,可以看出有部分重复数据 OK我们先进入hive 然后创建库uid create database uid; 然后创建表uid_id create table uid_id(uid_id int); 然后去重 select distinct uid_id from uid; 最后完成会弹一个提示里面有表的数据量就是出重后剩余的数量
相关文章
相关标签/搜索