欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

SQLServer 优化SQL语句 in 和not in的替代方案

程序员文章站 2023-12-05 18:38:04
但是用in的sql性能总是比较低的,从sql执行的步骤来分析用in的sql与不用in的sql有以下区别: sql试图将其转换成多个表的连接,如果转换不成功则先执行in里面的...
但是用in的sql性能总是比较低的,从sql执行的步骤来分析用in的sql与不用in的sql有以下区别:
sql试图将其转换成多个表的连接,如果转换不成功则先执行in里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用in的sql至少多了一个转换的过程。一般的sql都可以转换成功,但对于含有分组统计等方面的sql就不能转换了。 推荐在业务密集的sql当中尽量不采用in操作符
not in 此操作是强列推荐不使用的,因为它不能应用表的索引。推荐用not exists 或(外连接+判断为空)方案代替
  在数据库中有两个表,一个是当前表info(id,pname,remark,impdate,upstate),一个是备份数据表bakinfo(id,pname,remark,impdate,upstate),将当前表数据备份到备份表去,就涉及到not in 和in 操作了:
  首先,添加10万条测试数据
复制代码 代码如下:

create procedure adddata
as
declare @id int
set @id=0
while(@id<100000)
begin
insert into dbo.info(id,pname,remark,impdate,upstate)
values(@id,convert(varchar,@id)+'0','abc',getdate(),0)
set @id=@id+1
end
exec adddata

使用not in 和in操作:
复制代码 代码如下:

set statistics time on
go
--备份数据
insert into bakinfo(id,pname,remark,impdate,upstate)
select id,pname,remark,impdate,upstate from dbo.info
where id not in(select id from dbo.bakinfo)
go
set statistics time off

此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 3 毫秒。
sql server 执行时间:
cpu 时间 = 453 毫秒,占用时间 = 43045 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update info set upstate=1 where id in(select id from dbo.bakinfo)

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 62 毫秒,占用时间 = 79 毫秒。
sql server 执行时间:
cpu 时间 = 188 毫秒,占用时间 = 318 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--删除当前表数据
delete from info where upstate=1 and id in(select id from dbo.bakinfo)

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 183 毫秒,占用时间 = 183 毫秒。
sql server 执行时间:
cpu 时间 = 187 毫秒,占用时间 = 1506 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

  使用join连接替代方案:
复制代码 代码如下:

set statistics time on
go
--备份数据
insert into bakinfo(id,pname,remark,impdate,upstate)
select id,pname,remark,impdate,upstate from
(select info.id,info.pname, info.remark, info.impdate,info.upstate, bakinfo.id as bakid
from info left join
bakinfo on info.id = bakinfo.id ) as t
where t.bakid is null and t.upstate=0
go
set statistics time off;

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 247 毫秒,占用时间 = 247 毫秒。
sql server 执行时间:
cpu 时间 = 406 毫秒,占用时间 = 475 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update info set upstate=1
from info inner join
bakinfo on info.id = bakinfo.id

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 4 毫秒,占用时间 = 4 毫秒。
sql server 执行时间:
cpu 时间 = 219 毫秒,占用时间 = 259 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

--删除当前表数据
复制代码 代码如下:

delete from info
from info inner join
bakinfo on info.id = bakinfo.id
where info.upstate=1

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 177 毫秒,占用时间 = 177 毫秒。
sql server 执行时间:
cpu 时间 = 219 毫秒,占用时间 = 550 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

  可以看出使用join方案比使用not in 和in执行时间要短很多了