数据库中表存在重复数据,需要清理重复数据,清理后保留其中一条的情况是比较常见的需求,如何通过1条SQL准确的删除数据呢?
1. 创建表及测试数据1.1 数据库中创建一张测试表【如何正确的使用一条SQL删除重复数据】CREATE TABLE `test` (`id` INTNOT NULL AUTO_INCREMENT,`c1` VARCHAR(20) DEFAULT NULL,`c2` VARCHAR(20) DEFAULT NULL,`c3` INTDEFAULT NULL,`c4` DATETIME DEFAULT NULL,PRIMARY KEY (`id`)) ENGINE=INNODBDEFAULT CHARSET=utf8;
1.2 插入测试数据INSERT INTO test(c1,c2,c3,c4) VALUES( 'a','b',10, '2022-05-24 18:00:46'),('a','c',20, '2022-05-24 18:00:46');INSERT INTO test(c1,c2,c3,c4) VALUES( 'a','c',10, '2022-05-24 18:00:46'),('a','b',20, '2022-05-24 18:00:46');INSERT INTO test(c1,c2,c3,c4) VALUES( 'b','c',10, '2022-05-24 18:00:46'),('d','b',20, '2022-05-24 18:00:46');INSERT INTO test(c1,c2,c3,c4) VALUES( 'b','c',20, '2022-05-24 18:00:46'),('d','b',30, '2022-05-24 18:00:46');INSERT INTO test(c1,c2,c3,c4) VALUES( 'b','c',20, '2022-05-24 18:00:46'),('a','b',40, '2022-05-24 18:00:46');INSERT INTO test(c1,c2,c3,c4) VALUES( 'd','b',40, '2022-05-24 18:00:46'),('r','f',40, '2022-05-24 18:00:46');
1.3 查看重复数据例如c1,c2 这2个字段组合作为唯一条件,则查询重复数据的SQL如下
SELECTc1,c2,COUNT(*)FROMtestGROUP BY c1,c2HAVING COUNT(*) > 1;
可见,结果如下:
文章插图
2. 如何删除重复数据2.1 方案一很多研发同学习惯的思路如下:
- 先查出重复的记录(使用in)
- 再查出在重复记录但id不在每组id最大值的记录
- 直接将select 改为delete进行删除
SELECT *FROMtestWHERE (c1,c2) IN (SELECT c1,c2FROM test GROUP BY c1,c2 HAVING COUNT(*)>1 )ANDid NOTIN (SELECT MAX(id) FROMtest GROUP BY c1,c2 HAVING COUNT(*)>1) ORDER BY c1,c2;
文章插图
看上去比较符合结果了,但是改为delete执行的时候结果如下:
--delete SQLDELETE FROMtestWHERE (c1,c2) IN (SELECT c1,c2FROM test GROUP BY c1,c2 HAVING COUNT(*)>1 )ANDid NOTIN (SELECT MAX(id) FROMtest GROUP BY c1,c2 HAVING COUNT(*)>1)
出现报错信息:错误代码:1093You can't specify target table 'test' for update in FROM clause
也就是说MySQL里需删除的目标表在in子查询中时,不能直接执行删除操作 。3. 推荐写法基于以上情况,使用单条SQL删除的方式如下:
查询SQL:
SELECTa.*FROMtesta ,(SELECTc1,c2,MAX(id)id FROM testGROUP BY c1,c2 HAVING COUNT(*)>1)bWHEREa.c1=b.c1 AND a.c2=b.c2AND a.id <>b.id
文章插图
删除SQL
DELETEa FROMtesta ,(SELECTc1,c2,MAX(id)id FROM testGROUP BY c1,c2 HAVING COUNT(*)>1)bWHEREa.c1=b.c1 AND a.c2=b.c2AND a.id <>b.id
结果:<n>查询:delete a FROM test a , (select c1,c2,max(id)id from test group by c1,c2 having count(*)>1)b where a.c1=b.c1 and a.c2=b.c2 and a....共 7 行受到影响
删除后数据如下:文章插图
无重复数据了 。
推荐阅读
- 开个快递代理点怎么开。快递代理点的申请流程是怎样的?
- 乔立夫老婆照片、围捕乔立夫,世界散打冠军,1995年,8名刑警如何擒拿乔立夫
- 100转换成二进制是多少?100的十进制数如何转换?
- 工作必备技能有哪些 工作需要具备什么样的能力
- 本土文化与外来文化的关系 外来文化与本土文化之间
- 人活着的意义在哪里 人生命的意义在哪里
- 关于桥的美文摘抄 描写桥的句子唯美短句
- 最嗨音乐 比较嗨的
- 外星人谈老子 道解释宇宙的真相
- 历史上最动人的情诗 李清照最肉麻的一首诗