欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

如何删除oracle表中的重复数据

程序员文章站 2022-04-14 16:50:31
...

数据清理的时候常常会清除表中的重复的数据,那么在oracle中怎么处理呢?,下面介绍三种方法 

创建测试数据:

create table dupes(id integer,name varchar(100));
insert into dupes VALUES(1,'NAPOLEON');
insert into dupes VALUES(2,'DYNAMITE');
insert into dupes VALUES(3,'DYNAMITE');
insert into dupes VALUES(4,'SHE SELLS');
insert into dupes VALUES(5,'SEA SHELLS');
insert into dupes VALUES(6,'SEA SHELLS');
insert into dupes VALUES(7,'SEA SHELLS');

测试数据展示:
如何删除oracle表中的重复数据

方法一:name列有重复,id列无重复

----自关联删除重复数据
delete from dupes a where exists (select null from dupes b where b.name=a.name and a.id>b.id);

方法二:通过分析函数取出重复数据,然后删掉

---通过分析函数查出重复数据
select ROWID AS rid, name ,row_number()over(partition by name  order by id) as seq from dupes;
---删除重复数据
delete from dupes
 where ROWID IN (select rid
                   from (select ROWID AS rid,
                                name,
                                row_number() over(partition by name order by id) as seq
                           from dupes) a
                  where a.seq >1)

方法三:用ROWID代替表中的id

----通过ROWID
delete from dupes a where exists (select null from dupes b where b.name=a.name and b.rowid >a.rowid) 

总结:

1.可以通过唯一列(如主键列,ROWID等),方法一和方法三都是这个思想。

2.可以通过分析函数查询出重复数据的行号,然后删除即可。

3.分析函数通过重复列分组,唯一列排序,即可查询出重复数据

注:分析函数分组,排序查询重复数据的写法
语法:ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN)   

4.Select null 在与Exists配合使用时,只要有行返回,则Exists子查询仍然为True(下面是select null 与 exist配合查询出重复数据)。 

----通过ROWID查询出重复数据
select * from dupes a where exists (select null from dupes b where b.name=a.name and b.rowid >a.rowid) 

 

相关标签: 数据库