SQLServer 优化SQL语句 in 和not in的替代方案
程序员文章站
2023-12-15 18:48:52
但是用in的sql性能总是比较低的,从sql执行的步骤来分析用in的sql与不用in的sql有以下区别: sql试图将其转换成多个表的连接,如果转换不成功则先执行in里面的...
但是用in的sql性能总是比较低的,从sql执行的步骤来分析用in的sql与不用in的sql有以下区别:
sql试图将其转换成多个表的连接,如果转换不成功则先执行in里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用in的sql至少多了一个转换的过程。一般的sql都可以转换成功,但对于含有分组统计等方面的sql就不能转换了。 推荐在业务密集的sql当中尽量不采用in操作符
not in 此操作是强列推荐不使用的,因为它不能应用表的索引。推荐用not exists 或(外连接+判断为空)方案代替
在数据库中有两个表,一个是当前表info(id,pname,remark,impdate,upstate),一个是备份数据表bakinfo(id,pname,remark,impdate,upstate),将当前表数据备份到备份表去,就涉及到not in 和in 操作了:
首先,添加10万条测试数据
create procedure adddata
as
declare @id int
set @id=0
while(@id<100000)
begin
insert into dbo.info(id,pname,remark,impdate,upstate)
values(@id,convert(varchar,@id)+'0','abc',getdate(),0)
set @id=@id+1
end
exec adddata
使用not in 和in操作:
set statistics time on
go
--备份数据
insert into bakinfo(id,pname,remark,impdate,upstate)
select id,pname,remark,impdate,upstate from dbo.info
where id not in(select id from dbo.bakinfo)
go
set statistics time off
此操作执行时间:
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 3 毫秒。
sql server 执行时间:
cpu 时间 = 453 毫秒,占用时间 = 43045 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update info set upstate=1 where id in(select id from dbo.bakinfo)
此操作执行时间:
sql server 分析和编译时间:
cpu 时间 = 62 毫秒,占用时间 = 79 毫秒。
sql server 执行时间:
cpu 时间 = 188 毫秒,占用时间 = 318 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--删除当前表数据
delete from info where upstate=1 and id in(select id from dbo.bakinfo)
此操作执行时间:
sql server 分析和编译时间:
cpu 时间 = 183 毫秒,占用时间 = 183 毫秒。
sql server 执行时间:
cpu 时间 = 187 毫秒,占用时间 = 1506 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
使用join连接替代方案:
set statistics time on
go
--备份数据
insert into bakinfo(id,pname,remark,impdate,upstate)
select id,pname,remark,impdate,upstate from
(select info.id,info.pname, info.remark, info.impdate,info.upstate, bakinfo.id as bakid
from info left join
bakinfo on info.id = bakinfo.id ) as t
where t.bakid is null and t.upstate=0
go
set statistics time off;
此操作执行时间:
sql server 分析和编译时间:
cpu 时间 = 247 毫秒,占用时间 = 247 毫秒。
sql server 执行时间:
cpu 时间 = 406 毫秒,占用时间 = 475 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update info set upstate=1
from info inner join
bakinfo on info.id = bakinfo.id
此操作执行时间:
sql server 分析和编译时间:
cpu 时间 = 4 毫秒,占用时间 = 4 毫秒。
sql server 执行时间:
cpu 时间 = 219 毫秒,占用时间 = 259 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--删除当前表数据
delete from info
from info inner join
bakinfo on info.id = bakinfo.id
where info.upstate=1
此操作执行时间:
sql server 分析和编译时间:
cpu 时间 = 177 毫秒,占用时间 = 177 毫秒。
sql server 执行时间:
cpu 时间 = 219 毫秒,占用时间 = 550 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
可以看出使用join方案比使用not in 和in执行时间要短很多了
sql试图将其转换成多个表的连接,如果转换不成功则先执行in里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用in的sql至少多了一个转换的过程。一般的sql都可以转换成功,但对于含有分组统计等方面的sql就不能转换了。 推荐在业务密集的sql当中尽量不采用in操作符
not in 此操作是强列推荐不使用的,因为它不能应用表的索引。推荐用not exists 或(外连接+判断为空)方案代替
在数据库中有两个表,一个是当前表info(id,pname,remark,impdate,upstate),一个是备份数据表bakinfo(id,pname,remark,impdate,upstate),将当前表数据备份到备份表去,就涉及到not in 和in 操作了:
首先,添加10万条测试数据
复制代码 代码如下:
create procedure adddata
as
declare @id int
set @id=0
while(@id<100000)
begin
insert into dbo.info(id,pname,remark,impdate,upstate)
values(@id,convert(varchar,@id)+'0','abc',getdate(),0)
set @id=@id+1
end
exec adddata
使用not in 和in操作:
复制代码 代码如下:
set statistics time on
go
--备份数据
insert into bakinfo(id,pname,remark,impdate,upstate)
select id,pname,remark,impdate,upstate from dbo.info
where id not in(select id from dbo.bakinfo)
go
set statistics time off
此操作执行时间:
复制代码 代码如下:
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 3 毫秒。
sql server 执行时间:
cpu 时间 = 453 毫秒,占用时间 = 43045 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update info set upstate=1 where id in(select id from dbo.bakinfo)
此操作执行时间:
复制代码 代码如下:
sql server 分析和编译时间:
cpu 时间 = 62 毫秒,占用时间 = 79 毫秒。
sql server 执行时间:
cpu 时间 = 188 毫秒,占用时间 = 318 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--删除当前表数据
delete from info where upstate=1 and id in(select id from dbo.bakinfo)
此操作执行时间:
复制代码 代码如下:
sql server 分析和编译时间:
cpu 时间 = 183 毫秒,占用时间 = 183 毫秒。
sql server 执行时间:
cpu 时间 = 187 毫秒,占用时间 = 1506 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
使用join连接替代方案:
复制代码 代码如下:
set statistics time on
go
--备份数据
insert into bakinfo(id,pname,remark,impdate,upstate)
select id,pname,remark,impdate,upstate from
(select info.id,info.pname, info.remark, info.impdate,info.upstate, bakinfo.id as bakid
from info left join
bakinfo on info.id = bakinfo.id ) as t
where t.bakid is null and t.upstate=0
go
set statistics time off;
此操作执行时间:
复制代码 代码如下:
sql server 分析和编译时间:
cpu 时间 = 247 毫秒,占用时间 = 247 毫秒。
sql server 执行时间:
cpu 时间 = 406 毫秒,占用时间 = 475 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update info set upstate=1
from info inner join
bakinfo on info.id = bakinfo.id
此操作执行时间:
复制代码 代码如下:
sql server 分析和编译时间:
cpu 时间 = 4 毫秒,占用时间 = 4 毫秒。
sql server 执行时间:
cpu 时间 = 219 毫秒,占用时间 = 259 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--删除当前表数据
复制代码 代码如下:
delete from info
from info inner join
bakinfo on info.id = bakinfo.id
where info.upstate=1
此操作执行时间:
复制代码 代码如下:
sql server 分析和编译时间:
cpu 时间 = 177 毫秒,占用时间 = 177 毫秒。
sql server 执行时间:
cpu 时间 = 219 毫秒,占用时间 = 550 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
可以看出使用join方案比使用not in 和in执行时间要短很多了
推荐阅读
-
SQLServer 优化SQL语句 in 和not in的替代方案
-
SQLServer 优化SQL语句 in 和not in的替代方案
-
sql语句优化之用EXISTS替代IN、用NOT EXISTS替代NOT IN的语句
-
SQLSERVER 2005中使用sql语句对xml文件和其数据的进行操作(很全面)
-
MySQL在大数据、高并发场景下的SQL语句优化和"最佳实践"
-
一个SQL语句的优化(sqlserver)
-
海量数据库的查询优化及分页算法方案 2 之 改良SQL语句
-
SqlServer性能优化,查看CPU、内存占用大的会话及SQL语句
-
SQL语句优化之JOIN和LEFT JOIN 和 RIGHT JOIN语句的优化
-
SQLSERVER 2005中使用sql语句对xml文件和其数据的进行操作(很全