欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

oracle merge into的使用

程序员文章站 2022-05-12 19:14:09
...

在做报表的时候,遇到这么一个问题,由于数据量大,数据上传时间问题,经常要处理更新几天前的数据,这时需要涉及UPDATE或者INSERT两个操作,这时推荐用MERGE INTO,但用这个时候需注意一个问题,我先来一个测试: SQL select * from ytrep.tab1; COL_A COL_B

在做报表的时候,遇到这么一个问题,由于数据量大,数据上传时间问题,经常要处理更新几天前的数据,这时需要涉及UPDATE或者INSERT两个操作,这时推荐用MERGE INTO,但用这个时候需注意一个问题,我先来一个测试:


SQL> select * from ytrep.tab1;

COL_A COL_B COL_C
---------- ---------- ----------
1 A
2 B
3 C
4 D
5 E
6 F
7 G
8 H



8 rows selected


SQL> select * from ytrep.tab2;

COL_A COL_B COL_C COL_D
---------- ---------- ---------- ----------
1 A A1 1
1 A A1 2

2 B B1 1
3 C C1 1
4 D D1 1
5 E E1 2
5 E E2 1
6 F F1 1
6 F F1 2
9 G G1 1
10 H H1 1

11 rows selected

有以上两表,其中需要根据ytrep.tab2表的col_a及col_b值来更新ytrep.tab1的col_c值,这时,我们来执行以下SQL:

Merge into ytrep.tab1 p
using (
select t.col_A, t.col_B, col_C
from ytrep.tab2 t
) tmp
on (p.col_A= tmp.col_A and p.col_B= tmp.col_B)
when not matched then
insert (col_A, col_B, col_C) values (tmp.col_a, tmp.col_B, tmp.col_C)
when matched then
update set p.col_c = tmp.col_c;

提示:

ORA-30926: 无法在源表中获得一组稳定的行

ORA-30926: unable to get a stable set of rows in the source tables


好了,现在我们来分析为什么会出现这种错误,在ON条件里,我们可以看到p.col_A= tmp.col_A and p.col_B= tmp.col_B,

当tmp表返回记录后,ytrep.tab1取第一条记录 col_a = '1' and col_b = 'A' 与tmp表关联时,发现tmp有两条匹配的记录,这时ORACLE就无法判断到底UPDATE SET时应该取TMP表的哪条记录的COL_C值是A1还是A2了,这时ORACLE就返回以上错误;

这时,我们就可以推断,TMP结果集里返回的在ON条件里有涉及字段的值必须是唯一的,否则肯定报以上ORA-30926错误;


这时,有人也许会问,那到底该怎么写呢?

可分为两种情况:

1、一种是通过将TMP表的数据GROUP BY,取得MIN或MAX值;

Merge into ytrep.tab1 p
using (
select t.col_A, t.col_B, max(col_C) col_C --min(col_C) col_C
from ytrep.tab2 t
group by t.col_a, t.col_b
) tmp
on (p.col_A= tmp.col_A and p.col_B= tmp.col_B)
when not matched then
insert (col_A, col_B, col_C) values (tmp.col_a, tmp.col_B, tmp.col_C)
when matched then
update set p.col_c = tmp.col_c;


SQL> select * from ytrep.tab1;

COL_A COL_B COL_C
---------- ---------- ----------
1 A A1
2 B B1
3 C C1
4 D D1
5 E E2
6 F F1
7 G
8 H
10 H H1
9 G G1

10 rows selected


2、一种是分组后再根据某列值排序取第一行或最后一行值;

Merge into ytrep.tab1 p
using (
select distinct t.col_A, t.col_B, first_value(col_c) over (partition by t.col_a, t.col_b order by t.col_d asc) col_c
from ytrep.tab2 t
) tmp
on (p.col_A= tmp.col_A and p.col_B= tmp.col_B)
when not matched then
insert (col_A, col_B, col_C) values (tmp.col_a, tmp.col_B, tmp.col_C)
when matched then
update set p.col_c = tmp.col_c;



SQL> select * from ytrep.tab1;

COL_A COL_B COL_C
---------- ---------- ----------
1 A A1
2 B B1
3 C C1
4 D D1
5 E E2
6 F F1
7 G
8 H
10 H H1
9 G G1

10 rows selected


以上两个SQL,大家可以通过改变order by排序方式对比一下结果。


以上只是本人学习测试结果,如有不同意见或或好的建议,可以留言。谢谢!