当前位置: 代码网 > it编程>数据库>Mysql > MySQL中删除重复数据SQL的三种写法

MySQL中删除重复数据SQL的三种写法

2025年01月13日 Mysql 我要评论
要在 mysql 中删除重复的数据并只保留一条,可以使用下面的方法(要用的时候直接复制小改下条件和表名称即即可)方法一:使用 left join + 子查询删除重复数据(推荐)温馨提示:本人在 500

要在 mysql 中删除重复的数据并只保留一条,可以使用下面的方法(要用的时候直接复制小改下条件和表名称即即可)

方法一:使用 left join + 子查询删除重复数据(推荐)

温馨提示:本人在 500w 数据下执行此 sql 耗费 15s-30s 左右

使用 left join (推荐方法删除重复数据,添加唯一组合索引,可以使用,数据量大的也可以)

// 先把历史数据删除,才能够添加唯一的组合索引
delete u1
from uf_cs_record_batch_detail u1
left join (
    select min(id) as min_id
    from uf_cs_record_batch_detail
    group by cs_contact_name, cs_safe_remark
) u2
on u1.id = u2.min_id
where u2.min_id is null;

另外在附上添加唯一组合索引的 sql 写法(很实用):

// 添加组合的唯一索引
alter table uf_cs_record_batch_detail add unique key idx_uni_contact_safe_stat (cs_contact_name, cs_safe_remark);

方法二:创建临时表(需分多步执行,逻辑清晰,但会改变id值)

这种方法假设你有一个表 your_table,并且你要基于某些列来判断哪些数据是重复的。
例如,如果你想删除基于 column1 和 column2 的重复记录,只保留一条记录,你可以按照以下步骤操作:

  • 使用 create table 语句创建一个临时表,用于存储唯一的记录。
  • 使用 insert into ... select 语句将唯一的记录插入到临时表中。
  • 删除原始表中的所有记录。
  • 使用 insert into ... select 语句将临时表中的记录插入回原始表。
  • 删除临时表。

以下是一个完整的 sql 例子:

-- 创建临时表 sql 参考
createtable temp_table as
select*from your_table

-- 将不重复的数据临时存在这个 temp_table 临时表中
insertinto temp_table
select*from your_table t1
where t1.id = (
    selectmin(t2.id)
    from your_table t2
    where t1.column1 = t2.column1
    and t1.column2 = t2.column2
);

-- 然后将源表中的数据删除
deletefrom your_table wherewhere 字段1=值;

-- 再将临时表中不重复数据重新写回到源表中
insertinto your_table
select*from temp_table;

-- 最后删除临时表
droptable temp_table;

这样,你就成功地删除了原始表中的重复记录,只保留了一条唯一记录。

注意:但是这种方法会改变原来的数据 id ,所以这种方法看场合使用

方法三:使用 join 自连查询(需要注意性能问题)

为了避免改变原来的数据 id,我们可以使用一个不同的方法,通过使用自连接来标记重复的数据并删除多余的记录。这种方法在保留原始 id 的情况下删除重复记录。

假设你的表结构如下:

  • 表名:your_table
  • 列名:id (主键), column1column2, 以及其他列。

你可以使用以下 sql 来删除重复记录,只保留一条(通常是保留 id 最小的那一条):

-- step 1: 标记要删除的重复记录
delete t1
from your_table t1
inner join your_table t2 
where 
    t1.id > t2.id
    and t1.column1 = t2.column1
    and t1.column2 = t2.column2;

-- step 2: 确认删除成功,查看剩余数据
select * from your_table;

解释:

-标记要删除的重复记录:我们使用自连接 inner join 来找到重复的记录,并且使用 where t1.id > t2.id 来确保只删除 id 较大的记录,从而保 留 id 最小的记录。

  • 确认删除成功:通过 select 语句查看剩余的数据,确保删除操作正确。这个方法的优点是:不会改变原始数据的 id。保留每组重复记录中 id 最小的一条记录。操作简单且高效。

小总结

  • 使用 left join 删除重复数据(推荐使用),适合大数据量,性能 ok
  • 创建临时表 适合需要重建数据表的场景,适合数据量中等的情况,不过比较繁琐
  • 自连查询 能保留最小 id,适合不想改变 id 的情况下删除重复数据。

到此这篇关于mysql中删除重复数据sql的三种写法的文章就介绍到这了,更多相关mysql删除重复数据内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com