如何删除oracle表中的重复数据
程序员文章站
2022-04-14 16:50:31
...
数据清理的时候常常会清除表中的重复的数据,那么在oracle中怎么处理呢?,下面介绍三种方法
创建测试数据:
create table dupes(id integer,name varchar(100));
insert into dupes VALUES(1,'NAPOLEON');
insert into dupes VALUES(2,'DYNAMITE');
insert into dupes VALUES(3,'DYNAMITE');
insert into dupes VALUES(4,'SHE SELLS');
insert into dupes VALUES(5,'SEA SHELLS');
insert into dupes VALUES(6,'SEA SHELLS');
insert into dupes VALUES(7,'SEA SHELLS');
测试数据展示:
方法一:name列有重复,id列无重复
----自关联删除重复数据
delete from dupes a where exists (select null from dupes b where b.name=a.name and a.id>b.id);
方法二:通过分析函数取出重复数据,然后删掉
---通过分析函数查出重复数据
select ROWID AS rid, name ,row_number()over(partition by name order by id) as seq from dupes;
---删除重复数据
delete from dupes
where ROWID IN (select rid
from (select ROWID AS rid,
name,
row_number() over(partition by name order by id) as seq
from dupes) a
where a.seq >1)
方法三:用ROWID代替表中的id
----通过ROWID
delete from dupes a where exists (select null from dupes b where b.name=a.name and b.rowid >a.rowid)
总结:
1.可以通过唯一列(如主键列,ROWID等),方法一和方法三都是这个思想。
2.可以通过分析函数查询出重复数据的行号,然后删除即可。
3.分析函数通过重复列分组,唯一列排序,即可查询出重复数据
注:分析函数分组,排序查询重复数据的写法
语法:ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN)
4.Select null 在与Exists配合使用时,只要有行返回,则Exists子查询仍然为True(下面是select null 与 exist配合查询出重复数据)。
----通过ROWID查询出重复数据
select * from dupes a where exists (select null from dupes b where b.name=a.name and b.rowid >a.rowid)