欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

SQLServer 2000 升级到 SQLServer 2008 性能之需要注意的地方之一

程序员文章站 2023-12-02 21:15:16
测试sql: 复制代码 代码如下: set statistics io on set statistics time on select count(1) from dbo...
测试sql:
复制代码 代码如下:

set statistics io on
set statistics time on
select count(1)
from dbo.tbtext a
inner loop join dbo.tbtext b
on a.id = b.id option (maxdop 1)
set statistics io off
set statistics time off

表结构:
复制代码 代码如下:

create table [dbo].[tbtext](
[id] [int] identity(1,1) not null,
[value] [int] null
) on [primary]

单这句测试,看执行计划根本看不出区别。
|--compute scalar(define:([expr1006]=convert_implicit(int,[expr1009],0)))
|--stream aggregate(define:([expr1009]=count(*)))
|--nested loops(inner join, where:([northwind].[dbo].[tbtext].[id] as [b].[id]=[northwind].[dbo].[tbtext].[id] as [a].[id]))
|--table scan(object:([northwind].[dbo].[tbtext] as [a]))
|--table spool
|--table scan(object:([northwind].[dbo].[tbtext] as [b]))
2008r2:
复制代码 代码如下:

/*
警告: 由于使用了本地联接提示,联接次序得以强制实施。
表 'tbtext'。扫描计数 1,逻辑读取 46 次
(1 行受影响)
表 'worktable'。扫描计数 1,逻辑读取 290098 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tbtext'。扫描计数 2,逻辑读取 262 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(1 行受影响)
sql server 执行时间:
cpu 时间 = 32828 毫秒,占用时间 = 32846 毫秒。
sql server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 0 毫秒。
*/

2000sp4:
复制代码 代码如下:

/*
警告: 由于使用了局部联接提示,所以联接次序得以强制实施。
表 'tbtext'。扫描计数 1,逻辑读 131 次,物理读 0 次,预读 0 次。
sql server 执行时间:
cpu 时间 = 0 毫秒,耗费时间 = 0 毫秒。
表 'worktable'。扫描计数 9999,逻辑读 180001 次,物理读 0 次,预读 0 次。
表 'tbtext'。扫描计数 2,逻辑读 262 次,物理读 0 次,预读 138 次。
sql server 执行时间:
cpu 时间 = 17188 毫秒,耗费时间 = 17261 毫秒。
(1 行受影响)
sql server 执行时间:
cpu 时间 = 0 毫秒,耗费时间 = 0 毫秒。
*/

比较2000 和 2008的执行就能发现 2008 的cpu 时间明显比 2000 高,2008 的worktable 逻辑读取量,比2000的高,
这个有个worktable 的扫描技术,2000的是9999,2008的是1,这个让人难免有的疑惑是什么情况,都是nest loop,worktable 扫描不应该是1才对。
性能差怎么大会不会是 worktable 搞的鬼呢?
那么就开始调节,过滤id 会有啥发现呢?
复制代码 代码如下:

set statistics io on
set statistics time on
select count(1)
from dbo.tbtext a
inner loop join dbo.tbtext b
on a.id = b.id
where a.id <= 1000 option (maxdop 1)
select count(1)
from dbo.tbtext a
set statistics io off
set statistics time off

2008r2:
select count(1) from dbo.tbtext a inner loop join dbo.tbtext b on a.id = b.id where a.id <= 1000 option (maxdop 1)
|--compute scalar(define:([expr1006]=convert_implicit(int,[expr1009],0)))
|--stream aggregate(define:([expr1009]=count(*)))
|--nested loops(inner join, where:([northwind].[dbo].[tbtext].[id] as [b].[id]=[northwind].[dbo].[tbtext].[id] as [a].[id]))
|--table scan(object:([northwind].[dbo].[tbtext] as [a]), where:([northwind].[dbo].[tbtext].[id] as [a].[id]<=(1000)))
|--table spool
|--table scan(object:([northwind].[dbo].[tbtext] as [b]), where:([northwind].[dbo].[tbtext].[id] as [b].[id]<=(1000)))
复制代码 代码如下:

表 'worktable'。扫描计数 1,逻辑读取 6006 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tbtext'。扫描计数 2,逻辑读取 262 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

2000sp4:
|--compute scalar(define:([expr1002]=convert([expr1006])))
|--stream aggregate(define:([expr1006]=count(*)))
|--nested loops(inner join, where:([b].[id]=[a].[id]))
|--table scan(object:([northwind].[dbo].[tbtext] as [a]), where:([a].[id]<=1000))
|--table spool
|--table scan(object:([northwind].[dbo].[tbtext] as [b]))
复制代码 代码如下:

表 'worktable'。扫描计数 999,逻辑读 27001 次,物理读 0 次,预读 0 次。
表 'tbtext'。扫描计数 2,逻辑读 262 次,物理读 0 次,预读 0次。

进入 lazy spool的数据完全不一样了,2008 只是进入了1000 条数据,但是2000 全都进去了。
在逻辑读上面 2008 明显低于 2000. cpu时间也明显比2000少。
通过调节id 的值,2000 我推出了一个公式 逻辑读= 10001+(17*n) ,
但是2008的算法十分奇怪,
当n < 386 时 逻辑读=3+4(n-1)
当 386<=n<=770 逻辑读= 1932+5(n-386)
2000的逻辑读是线性增长,2008 是分段的线性增长,每个分段 f '(x) 都不一样。
2008 的lazy spool适合选择度高的,选择度低的时候完全不行。
从2000到2008 不单单是多了sqlos和表面上的一些功能,很多执行计划的操作符都被重写了,像lazy spool 。
所以在升级到2008 之前,
各位朋友,是否都应该重写一下sql 呢?单单优化 索引 已经解决不了根本问题了。