SQLServer Execpt和not in 性能区别
程序员文章站
2023-12-04 12:23:34
主要讲 except 和 not in 的性能上的区别。 复制代码 代码如下: create table tb1(id int) create table tb2(id i...
主要讲 except 和 not in 的性能上的区别。
create table tb1(id int)
create table tb2(id int)
begin tran
declare @i int = 500
while @i > 0
begin
insert into dbo.tb1
values ( @i -- v - int
)
set @i = @i -1
end
commit我测试的时候tb1 是1000,tb2 是500
dbcc freesystemcache ('all','default');
set statistics io on
set statistics time on
select * from tb1 except select * from tb2;
select * from tb1 where id not in(select id from tb2);--得不到任何值
set statistics io off
set statistics time off
执行计划:
select * from tb1 except select * from tb2;
|--merge join(right anti semi join, merge:([master1].[dbo].[tb2].[id])=([master1].[dbo].[tb1].[id]), residual:([master1].[dbo].[tb1].[id] = [master1].[dbo].[tb2].[id]))
|--sort(distinct order by:([master1].[dbo].[tb2].[id] asc))
| |--table scan(object:([master1].[dbo].[tb2]))
|--sort(distinct order by:([master1].[dbo].[tb1].[id] asc))
|--table scan(object:([master1].[dbo].[tb1]))
select * from tb1 where id not in(select id from tb2);--得不到任何值
|--hash match(right anti semi join, hash:([master1].[dbo].[tb2].[id])=([master1].[dbo].[tb1].[id]), residual:([master1].[dbo].[tb1].[id]=[master1].[dbo].[tb2].[id]))
|--table scan(object:([master1].[dbo].[tb2]))
|--nested loops(left anti semi join)
|--nested loops(left anti semi join, where:([master1].[dbo].[tb1].[id] is null))
| |--table scan(object:([master1].[dbo].[tb1]))
| |--top(top expression:((1)))
| |--table scan(object:([master1].[dbo].[tb2]))
|--row count spool
|--table scan(object:([master1].[dbo].[tb2]), where:([master1].[dbo].[tb2].[id] is null))
sql server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 0 毫秒。
(500 行受影响)
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 1,逻辑读取 1 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(6 行受影响)
(1 行受影响)
sql server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 528 毫秒。
(500 行受影响)
表 'worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 3,逻辑读取 1002 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(10 行受影响)
(1 行受影响)
sql server 执行时间:
cpu 时间 = 16 毫秒,占用时间 = 498 毫秒。
sql server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 0 毫秒。
结论:通过较多数据 和 较少数据的测试,在较少数据的情况下 not in 比 except 性能好,但是在较多数据情况下 execpt 比 not in 出色。
看执行计划可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的执行计划开可以得到优化。
如果大家有兴趣可以看看 not exists 的执行计划。建议:
大家不要迷信测试结果,因为所有的性能都是和执行计划密切相关的。而执行计划和统计数据又密不可分。
所以过度的迷信测试结果,可能会对生产库造成性能的影响达不到预期的性能效果。
复制代码 代码如下:
create table tb1(id int)
create table tb2(id int)
begin tran
declare @i int = 500
while @i > 0
begin
insert into dbo.tb1
values ( @i -- v - int
)
set @i = @i -1
end
commit我测试的时候tb1 是1000,tb2 是500
复制代码 代码如下:
dbcc freesystemcache ('all','default');
set statistics io on
set statistics time on
select * from tb1 except select * from tb2;
select * from tb1 where id not in(select id from tb2);--得不到任何值
set statistics io off
set statistics time off
执行计划:
复制代码 代码如下:
select * from tb1 except select * from tb2;
|--merge join(right anti semi join, merge:([master1].[dbo].[tb2].[id])=([master1].[dbo].[tb1].[id]), residual:([master1].[dbo].[tb1].[id] = [master1].[dbo].[tb2].[id]))
|--sort(distinct order by:([master1].[dbo].[tb2].[id] asc))
| |--table scan(object:([master1].[dbo].[tb2]))
|--sort(distinct order by:([master1].[dbo].[tb1].[id] asc))
|--table scan(object:([master1].[dbo].[tb1]))
复制代码 代码如下:
select * from tb1 where id not in(select id from tb2);--得不到任何值
|--hash match(right anti semi join, hash:([master1].[dbo].[tb2].[id])=([master1].[dbo].[tb1].[id]), residual:([master1].[dbo].[tb1].[id]=[master1].[dbo].[tb2].[id]))
|--table scan(object:([master1].[dbo].[tb2]))
|--nested loops(left anti semi join)
|--nested loops(left anti semi join, where:([master1].[dbo].[tb1].[id] is null))
| |--table scan(object:([master1].[dbo].[tb1]))
| |--top(top expression:((1)))
| |--table scan(object:([master1].[dbo].[tb2]))
|--row count spool
|--table scan(object:([master1].[dbo].[tb2]), where:([master1].[dbo].[tb2].[id] is null))
sql server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 0 毫秒。
(500 行受影响)
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 1,逻辑读取 1 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(6 行受影响)
(1 行受影响)
sql server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 528 毫秒。
(500 行受影响)
表 'worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 3,逻辑读取 1002 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(10 行受影响)
(1 行受影响)
sql server 执行时间:
cpu 时间 = 16 毫秒,占用时间 = 498 毫秒。
sql server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 0 毫秒。
结论:通过较多数据 和 较少数据的测试,在较少数据的情况下 not in 比 except 性能好,但是在较多数据情况下 execpt 比 not in 出色。
看执行计划可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的执行计划开可以得到优化。
如果大家有兴趣可以看看 not exists 的执行计划。建议:
大家不要迷信测试结果,因为所有的性能都是和执行计划密切相关的。而执行计划和统计数据又密不可分。
所以过度的迷信测试结果,可能会对生产库造成性能的影响达不到预期的性能效果。
上一篇: 获取星期几的名称
下一篇: Java将图片组合成PDF文件的方法
推荐阅读
-
SQLServer Execpt和not in 性能区别
-
SQLSERVER全文目录全文索引的使用方法和区别讲解
-
SQLserver中字符串查找功能patindex和charindex的区别
-
千兆网卡Intel 82567和82574的性能区别
-
sqlserver中delete、update中使用表别名和oracle的区别
-
i7-700K和Ryzen7 1700哪个好?i7-700K和Ryzen7 1700性能/价格详细区别对比评测
-
i3和i5性能差多少?Intel i3与i5处理器的区别对比介绍
-
i7-7740X和i7-7700K的区别是什么 i7-7740X与i7-7700K性能对比测试图解
-
sqlserver2005性能监视器计数器要求错误和com+目录要求错误解决
-
sqlserver2005利用临时表和@@RowCount提高分页查询存储过程性能示例分享