update 子查询使用介绍
基础知识
1, 关联子查询和非关联子查询
在非关联子查询中,内部查询只执行一次并返回它的值给外部查询,然后外部查询在它的处理中使用内部查询返回给它的值。而在关联子查询中,对于外部查询返回的每一行数据,内部查询都要执行一次。另外,在关联子查询中是信息流是双向的。外部查询的每行数据传递一个值给子查询,然后子查询为每一行数据执行一次并返回它的记录。然后,外部查询根据返回的记录做出决策。
如:
select o1.customerid, o1.orderid, o1.orderdate from orders o1 where o1.orderdate = (select max(orderdate) from orders o2 where o2.customerid = o1.customerid)
是一个关联子查询
select o1.customerid, o1.orderid, o1.orderdate from orders o1 where o1.orderdate in (select top 2 o2.orderdate from orders o2 where o2.customerid = o1.customerid) order by customerid
是一个非关联子查询
2, 提示(hint)
一般在优化时,无论采用基于规则的或是基于代价的方法,由oracle系统的优化器来决定语句的执行路径。这样的选择的路径不要见得是最好的。所以,oracle提供了一种方法叫提示的方法。它可以让编程人员按照自己的要求来选择执行路径,即提示优化器该按照什么样的执行规则来执行当前的语句。这样可以在性能上比起oracle优化自主决定要好些。
通常情况下,编程人员可以利用提示来进行优化决策。通过运用提示可以对下面内容进行指定:
l sql语句的优化方法;
l 对于某条sql语句,基于开销优化程序的目标;
l sql语句访问的访问路径;
l 连接语句的连接次序;
l 连接语句中的连接操作。
如果希望优化器按照编程人员的要求执行,则要在语句中给出提示。提示的有效范围有限制,即有提示的语句块才能按照提示要求执行。下面语句可以指定提示:
l 简单的select ,update ,delete 语句;
l 复合的主语句或子查询语句;
l 组成查询(union)的一部分。
提示的指定有原来的注释语句在加“+”构成。语法如下:
[ select | delete|update ] /*+ [hint | text ] */
或
[ select | delete|update ] --+ [hint | text ]
注意在“/*”后不要空就直接加“+”,同样 “--+”也是连着写。
警告:如果该提示语句书写不正确,则oracle就忽略掉该语句。
常见的提示有:
ordered 强制按照from子句中指定的表的顺序进行连接
use_nl 强制指定两个表间的连接方式为嵌套循环(nested loops)
use_hash 强制指定两个表间的连接方式为哈希连接(hash join)
use_merge 强制指定两个表间的连接方式为合并排序连接(merge join)
push_subq 让非关联子查询提前执行
index 强制使用某个索引
3, 执行计划
在pl/sql developer的sql windows中用鼠标或键盘选中sql语句,然后按f5,就会出现执行计划解析的界面:
4, update的特点
update的系统内部执行情况可以参照附文:对update事务的内部分析.doc
使用update的基本要点就是,
1) 尽量使用更新表上的索引,减少不必要的更新
2) 更新的数据来源花费时间尽可能短,如果无法做到就把更新内容插入到中间表中,然后给中间表建上索引,再来更新
3) 如果更新的是主键,建议删除再插入。
5, 示例用表
后面的阐述将围绕以下两张表展开:
create table tab1 (workdate varchar2(8), cino varchar2(15), val1 number, val2 number);
create table tab2 (workdate varchar2(8), cino varchar2(15), val1 number, val2 number);
create table tab3 (workdate varchar2(8), cino varchar2(15), val1 number, val2 number);
create table tab4 (workdate varchar2(8), cino varchar2(15), val1 number, val2 number);
workdate, cino为两张表的关键字,默认情况没有建主键索引。
二,update两种情况
用update更新某个表,无外乎是两种情况:根据关联子查询,更新字段;通过非关联子查询,限定更新范围。如果还有第三种情况,那就是前两种情况的叠加。
1, 根据关联子查询,更新字段
update tab1 t set (val1, val2) = (select val1, val2 from tab2 where workdate = t.workdate and cino = t.cino);
通过tab2来更新tab1的相应字段。执行sql语句时,系统会从tab1中一行一行读记录,然后再通过关联子查询,找到相应的字段来更新。关联子查询能否通过tab1的条件快速的查找到对应记录,是优化能否实现的必要条件。所以一般都要求在tab2上建有unique或者排重性较高的normal索引。执行所用时间大概为(查询tab1中一条记录所用的时间 + 在tab2中查询一条记录所用的时间)* tab1中的记录条数。
如果子查询条件比较复杂,如以下语句:
update tab1 t set (val1, val2) = (select val1, val2 from tab2 tt where exists (select 1 from tab3 where workdate = tt.workdate and cino = tt.cino) and workdate = t.workdate and cino = t.cino);
这时更新tab1中的每条记录花费在子查询上的时间将成倍增加,如果tab1中的记录数较多,这种更新语句几乎是不可完成。
解决方式是,把子查询提取出来,做到中间表中,然后给中间表建上索引,用中间表来代替子查询,这样速度就能大大提高:
insert into tab4 select workdate, cino, val1, val2 from tab2 tt where exists (select 1 from tab3 where workdate = tt.workdate and cino = tt.cino); create index tab4_ind01 on tab4(workdate, cino); update tab1 t set (val1, val2) = (select val1, val2 from tab4 tt where workdate = t.workdate and cino = t.cino);
2, 通过非关联子查询,限定更新范围
update tab1 t set val1 = 1 where (workdate, cino) in (select workdate, cino from tab2)
根据tab2提供的数据范围,来更新tab1中的相应记录的val1字段。
在这种情况下,系统默认执行方式往往是先执行select workdate, cino from tab2子查询,在系统中形成系统视图,然后在tab1中选取一条记录,查询系统视图中是否存在相应的workdate, cino组合,如果存在,则更新tab1,如果不存在,则选取下一条记录。这种方式的查询时间大致等于:子查询查询时间 + (在tab1中选取一条记录的时间 + 在系统视图中全表扫描寻找一条记录时间)* tab1的记录条数。其中“在系统视图中全表扫描寻找一条记录时间”会根据tab2的大小而有所不同。若tab2记录数较小,系统可以直接把表读到系统区中;若tab2记录数多,系统无法形成系统视图,这时会每一次更新动作,就把子查询做一次,速度会非常的慢。
针对这种情况的优化有两种
1) 在tab1上的workdate, cino字段上加入索引,同时增加提示。
修改以后的sql语句如下:
update /*+ordered use_nl(sys, t)*/ tab1 t set val1 = 1 where (workdate, cino) in (select workdate, cino from tab2)
其中sys表示系统视图。如果不加入ordered提示,系统将会默认以tab1表作为驱动表,这时就要对tab1作全表扫描。加入提示后,使用系统视图,即select workdate, cino from tab2,作为驱动表,在正常情况下,速度能提高很多。
2) 在tab2表上的workdate, cino字段加入索引,同时改写sql语句:
update tab1 t set val1 = 1 where exists (select 1 from tab2 where workdate = t.workdate and cino = t.cino)
三,索引问题
update索引的使用比较特殊,有时看起来能用全索引,但实际上却只用到一部分,所以建议把复合索引的各字段写在一起。
例如:
update /*+ordered use_nl(sys, t)*/ tab1 t set val1 = 1 where cino in (select cino from tab2) and workdate = '200506'
这条sql语句是不能完全用到tab1上的复合索引workdate + cino的。能用到的只是workdate='200506'的约束。
如果写成这样,就没问题:
update /*+ordered use_nl(sys, t)*/ tab1 t set val1 = 1 where (workdate, cino) in (select workdate, cino from tab2)
推荐阅读
-
python 之 数据库(多表查询之连接查询、子查询、pymysql模块的使用)
-
MySQL使用命令创建、删除、查询索引的介绍
-
LeetCode——Department Top Three Salaries(巧妙使用子查询)
-
MySQL使用子查询注意事项及使用技巧
-
oracle中UPDATE nowait 的使用方法介绍
-
Mysql查询语句使用select.. for update导致的数据库死锁分析
-
解决MySQL中IN子查询会导致无法使用索引问题
-
MySQL优化之使用连接(join)代替子查询
-
如何通过微信小程序查询附近WIFI密码?wifi密码查看器官方版小程序使用方法介绍
-
MySQL数据库update更新子查询