MySQL 查询重复数据,删除重复数据保留id最小的一条做为惟一数据

开发背景:

  最近在作一个批量数据导入到MySQL数据库的功能,从批量导入就能够知道,这样的数据在插入数据库以前是不会进行重复判断的,所以只有在所有数据导入进去之后在执行一条语句进行删除,保证数据惟一性。数据库

实战:

表结构以下图所示:

代表:brandspa

 

操做:

使用SQL语句查询重复的数据有哪些:

SELECT * from brand WHERE brandName IN(
select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1 #条件是数量大于1的重复数据
)

使用SQL删除多余的重复数据,并保留Id最小的一条惟一数据:

注意点:

错误SQL:DELETE FROM brand WHERE brandName IN (select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1) 
AND Id NOT IN (select MIN(Id) from brand GROUP BY brandName HAVING COUNT(brandName)>1)

 

提示: You can't specify target table 'brand' for update in FROM clause   不能为FROM子句中的更新指定目标表“brand”code

缘由是:不能将直接查处来的数据当作删除数据的条件,咱们应该先把查出来的数据新建一个临时表,而后再把临时表做为条件进行删除功能blog

正确SQL写法:

 DELETE FROM brand WHERE brandName IN (SELECT brandName FROM (SELECT brandName FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) e)
AND Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) t)
#查询显示重复的数据都是显示最前面的几条,所以不须要查询是否最小值

更加简单快捷的方式:

这是老飞飞的前辈给了一个更加方便,简洁的写法(很是感谢大佬的方法):ci

DELETE FROM brand WHERE Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName) t)

这句的意思其实就是,经过分组统计出数据库中不重复的最小数据id编号,让后经过 not in 去删除其余重复多余的数据。资源

结果以下图:

总结:

         不少东西都是须要本身一步一步的去探究的,固然网上的建议也是很是宝贵的借鉴和资源,不管作什么开发咱们都须要理解它的工做原理才可以更好的掌握它。开发

相关文章
相关标签/搜索