MySQL如何删除重复数据 _MySQL

MySQL中经常会遇到重复的数据，那么当我们遇到重复的时候的时候，如果定位哪些数据是有重复的记录？如何删除重复的数据？我们该怎么做呢？接下来我们一步步来分析一下遇到这样的情况后，该如何处理。

文章插图
咋办呢？
初始化实验环境我们创建一个简单的表user_info，然后基于这个表进行分析重复数据的处理情况。其中的id为自增主键，name、sex、age三个列是我们判断是否为重复数据的key，如果这三列的值相同，则认为这行数据为重复数据。

建表语句如下：

CREATE TABLE `user_info` (`id` int(10) unsigned NOT NULL AUTO_INCREMENT,`name` varchar(255) DEFAULT NULL,`sex` varchar(255) DEFAULT NULL,`age` int(11) DEFAULT NULL,`remark` varchar(255) DEFAULT NULL,PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=13 DEFAULT CHARSET=utf8;

初始化数据如下：

INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (1, 'A', '男', 22, '第一个A');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (2, 'B', '女', 33, '第一个B');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (3, 'C', '男', 44, '第一个C');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (4, 'D', '女', 55, '第一个D');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (5, 'A', '男', 22, '第二个A');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (6, 'B', '女', 33, '第二个B');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (7, 'C', '男', 44, '第二个C');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (8, 'D', '女', 55, '第二个D');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (9, 'E', '男', 18, '第一个E');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (10, 'A', '男', 22, '第三个A');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (11, 'B', '女', 33, '第三个B');INSERT INTO `tmp_test`.`user_info`(`id`, `name`, `sex`, `age`, `remark`) VALUES (12, 'F', '男', 15, '第一个F');

最后表中数据如下:

文章插图
初始化的测试数据
明确需求假设我们的要求是保留重复数据中，第一次出现的数据，后面出现的数据不保留。
也就是我们的上面的这个表中每一组重复数据中id最小的一行数据需要保留，其他比较大的id的重复的数据行需要被删除。当然如果是要保留id行最大的一行数据最为最后的数据行也是可以了，只要在查询的时候，稍微修改一下SQL语句的min(id)或max(id)函数即可。

文章插图
开整
查找重复的数据基于前面我们初始化的实验数据，首先我们要查询出那些数据是有重复数据的行，通过下面的SQL语句，可以得到结果：其中有重复数据的是name值为A、B、C、D的四种类型的数据。

使用如下SQL可以查询出来那些数据行有重复记录，并统计出重新出现的次数。

selectname, sex, age,count(*) as count -- 数据重复出现的次数from user_info group by name, sex, age having count(*) > 1;

重复数据在表中的统计结果如下：

文章插图
数据重复的统计情况
查找要保留的数据上面我们知道该如何查询哪些数据是重复数据了，那么我们需要保留的数据是哪些？

使用下面的SQL既可以获取到我们要保留的数据行：

select * from user_info where id in ( selectmin(id)from user_infogroup by name, sex, age);

结果如下：

文章插图
每组重复数据中，id值最小的数据行
上面的结果就是我们需要最后留下来的数据。这里包含了非重复的时候和每一组重复的数据中id最小的数据行。
删除重复的数据方法一这是最笨的一种方式，也是最容易理解的一种方式，效率也比较低。思路如下：

MySQL如何删除重复数据

推荐阅读

哪些人不宜食用牛肉干？牛肉干的副作用有哪些?

糖尿病人血糖好，要会吃午餐和晚餐，健康的两餐怎么吃？

第五大道@难怪穿它的人都气质动人，从明星身上学穿搭！荷叶边简直太美了

北京有哪些值得带的特产

电脑报 NZXT恩杰DIY日双·11年终狂欢持续中

举人力量|忧郁的小眼神简太神似，网友的评论亮了，杨丞琳晒“狗界”李荣浩

失信人|失信人欠债不还却捐20万建宗祠？当事人：5年前就捐了，当时有钱

梓原|“金鹰奖”今年会撕得很难看吗？

【】穗一公寓日本籍住户新冠初筛阳性复检结果为阴性

四本科幻小说，星际时代，龙争虎斗，获得潜能开发，坐拥美女芳心

快了棒棒糖|不信神的中国人和神权美国的恐惧症！

应届毕业生IT去日本工作

腿子韧带拉伤了怎么办,腿部韧带拉伤的症状及处理方法-

天下军事秘闻绝密文件涂改失误，意外曝光涉“9.11”袭击细节，美国特工闯大祸

【】北京允许低风险地区举办500人以下体育赛事活动

嫁接桃树的时间和方法的细节

路由器购买指南，和网络不稳定、断网说拜拜

「红烧狮子头」红烧狮子头是哪个地方的菜

原神：4.3水下尘歌壶实机，仆人立绘！留云加强，阿贝多砂糖新皮肤首爆！

最练气质的瑜伽