MySQL去重的方法整理

程序员文章站 2022-05-19 09:06:05

mysql去重的方法整理【初级】有极少的重复行使用distinct查出来，然后手动一行一行删除。【中级】按照单个字段的重复去重例如：对id字段去重使用方...

mysql去重的方法整理

【初级】有极少的重复行

使用distinct查出来，然后手动一行一行删除。

【中级】按照单个字段的重复去重

例如：对id字段去重

使用方法：获取id的重复字段的值，利用相同id字段所在的行中，比较出数据不同的字段，删除除了最小（或最大）的字段所在的该行之外的所有重复的行。一般使用主键来比较，因为主键的值一定是唯一值，绝对不相同。

id  name

1    a

1    b

2    c

2    a

3    c

结果：

id  name

1    a 

2    a

操作：

delete from a_tmp 

where id in (select * from (select b.id from a_tmp b group by b.id having count(b.id) >1) bb) 

and name not in (select * from (select min(a.name) from a_tmp a group by a.id having count(a.id) >1) aa);

注意：

上述加粗并绿色的字，必须加别名，必须使用select * from (……)这样的格式，否则会报错：

[err] 1093 - you can't specify target table 'a_tmp' for update in from clause

【高级】按多个字段的重复来去重

例如：对id，name相同的去重，即：对id，name都相同的算作重复行，对id相同而name不同的算作不重复行

使用方法：和单个字段相似，一般使用主键来比较，因为主键的值一定是唯一值。

id  name  rowid

1  a      1

1  a      2

1  b      3

2  b      4

2  b      5

3  c      6

3  d     7

结果：

id  name  rowid

1  a      1 

1  b      3

2  b      4

3  c      6

3  d     7

操作：

第一种：

delete from a_tmp 

where (id,name) in (select * from (select b.id,b.name from a_tmp b group by b.id,b.name having count(b.id) >1) bb) 

and rowid not in (select * from (select min(a.rowid) from a_tmp a group by a.id,a.name having count(a.id) >1) aa);

第二种：

将id和name字段的值连接起来插入到临时表中b_tmp，这样便可以使用【中级】的单字段的判断删除方法。

#将两字段连接的值，a_tmp表中唯一值的字段插入b_tmp表

insert into b_tmp 

 select concat(id,name),rowid from a_tmp;

#查出需要留下来的行

select id_name,max(rowid)

 from b_tmp 

 group by id_name

 having count(id_name)>1;

#使用【中级】的方法，或存储过程完成去重的工作

【终极】每行都有两份一样的数据

例如：

使用方法：对于整行的数据都一样，是没办法使用sql语句删除的，因为没有可以使用的条件限制来留下一行删除所有与其相同的行。没有不同的字段可以自己创造不同的字段，即：添加一个字段，设为自增长，并设为主键，它会自动添加上值。

id  name

1   a

1   a

1   b

1   b

2   c

2   c

3   c

3   c

结果：

id  name   rowid

1   a       1

1   b       3

2   c       5

3   c       7

操作：

添加一个自增长的字段，并暂时设为主键。

使用上面【中级】和【高级】的方法操作。

感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

上一篇：如何用javascript正则表达式验证身份证号码是否合法

下一篇： js正则表达式验证大全(收集)

MySQL去重的方法整理

使用python opencv对目录下图片进行去重的方法

不去壳怎么去虾线，没想到吧，简简单单的方法就搞定了

mysql出现Error performing load command的解决方法

log引起的mysql不能启动的解决方法

mysql 时间转换函数的使用方法第1/2页

MySQL忘记密码恢复密码的实现方法

mysql 记录不存在时插入记录存在则更新的实现方法

Mysql指定日期区间的提取方法

mysql主从复制读写分离的配置方法详解

mysql启动时出现ERROR 2003 (HY000)问题的解决方法

MySQL去重的方法整理

使用python opencv对目录下图片进行去重的方法

不去壳怎么去虾线，没想到吧，简简单单的方法就搞定了

mysql出现Error performing load command的解决方法

log引起的mysql不能启动的解决方法

mysql 时间转换函数的使用方法第1/2页

MySQL忘记密码恢复密码的实现方法

mysql 记录不存在时插入 记录存在则更新的实现方法

Mysql指定日期区间的提取方法

mysql主从复制读写分离的配置方法详解

mysql启动时出现ERROR 2003 (HY000)问题的解决方法

mysql 记录不存在时插入记录存在则更新的实现方法