欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

SQLSERVER聚集索引与非聚集索引的再次研究(下)

程序员文章站 2024-01-18 20:42:10
...

SQLSERVER聚集索引与非聚集索引的再次研究(下) 上篇主要说了聚集索引和简单介绍了一下非聚集索引,相信大家一定对聚集索引和非聚集索引开始有一点了解了。 这篇文章只是作为参考,里面的观点不一定正确 上篇的地址:SQLSERVER聚集索引与非聚集索引的再次研

SQLSERVER聚集索引与非聚集索引的再次研究(下)

上篇主要说了聚集索引和简单介绍了一下非聚集索引,相信大家一定对聚集索引和非聚集索引开始有一点了解了。

这篇文章只是作为参考,里面的观点不一定正确

上篇的地址:SQLSERVER聚集索引与非聚集索引的再次研究(上)

下篇主要说非聚集索引

先上非聚集索引的结构图

SQLSERVER聚集索引与非聚集索引的再次研究(下)

先创建Department8表

 1 --非聚集索引
 2 USE [pratice] 
 3 GO
 4 
 5 CREATE TABLE Department8(
 6     DepartmentID int IDENTITY(1,1) NOT NULL ,
 7     Name NVARCHAR(200) NOT NULL,
 8     GroupName NVARCHAR(200) NOT NULL,
 9     Company NVARCHAR(300),
10     ModifiedDate datetime NOT NULL  DEFAULT (getdate())
11 )
12 
13 
14 CREATE NONCLUSTERED INDEX NCL_Name_GroupName ON [dbo].[Department8](Name,[GroupName])
15 
16 DECLARE @i INT
17 SET @i=1
18 WHILE @i  100
19     BEGIN
20         INSERT  INTO Department8 ( name, [Company], groupname )
21         VALUES  ( '销售部'+CAST(@i AS VARCHAR(200)), '中国你好有限公司XX分公司', '销售组'+CAST(@i AS VARCHAR(200)) )
22         SET @i = @i + 1
23     END
24     
25 SELECT * FROM [dbo].[Department8]
26 
27 --TRUNCATE TABLE [dbo].[DBCCResult]
28 INSERT INTO DBCCResult EXEC ('DBCC IND(pratice,Department8,-1) ')
29 
30 SELECT * FROM [dbo].[DBCCResult] ORDER BY [PageType] DESC 

先说明一下:

PageType 分页类型: 1:数据页面;2:索引页面;3:Lob_mixed_page;4:Lob_tree_page;10:IAM页面

IndexID 索引ID: 0 代表堆, 1 代表聚集索引, 2-250 代表非聚集索引 ,大于250就是text或image字段

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

每个数据页的IndexID都是0,说明数据页不属于非聚集索引的一部分,如果你有看到本系列的上篇,你会看到聚集索引表里数据页的IndexID都是1

说明数据页属于聚集索引的一部分,这里非聚集索引表的数据页的IndexID不是2而是0

SQLSERVER聚集索引与非聚集索引的再次研究(下)

-------------------------------------------------华丽的分割线--------------------------------------------------

下面看一下非聚集索引的索引页

1 DBCC TRACEON(3604,-1)
2 GO
3 DBCC PAGE([pratice],1,14499,3)
4 GO

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

聚集索引跟非聚集索引不同,聚集索引页里的一行表示一个数据页,而且标记了这个数据页索引字段的范围值

而非聚集索引跟数据表的记录一一对应,非聚集索引页里的一行记录表示数据表的一行记录,而且记录了指向实际记录的指针

其实非聚集索引的所有索引页合并在一起就是数据表的一个缩小版表中只有非聚集索引),索引页中只包含创建非聚集索引时的字段,

所以当数据量少的时候,会使用全表扫描而不用索引扫描,因为堆中的数据页包含了表的全部字段 而索引页只包含了索引的字段,当select的时候

无论你是select * 还是select 某个字段 ,在效率上会差不多但是可以select出来的数据就会多很多

------------------------------------------------华丽的分割线--------------------------------------------------------------

那么非聚集索引是怎麽查找记录的?

这里分两种情况:(1)非聚集索引查找(2)非聚集索引扫描

这一次我就非聚集索引查找和非聚集索引扫描一起讲了,不像《SQLSERVER聚集索引与非聚集索引的再次研究(上)》里那样

查找和扫描分开来讲

这里创建Department9表,由于Department8表只有99行记录,数据量少的话SQLSERVER会直接走全表扫描,看不出效果

SQLSERVER聚集索引与非聚集索引的再次研究(下)SQLSERVER聚集索引与非聚集索引的再次研究(下)

 1 --非聚集索引
 2 USE [pratice] 
 3 GO
 4 
 5 CREATE TABLE Department9(
 6     DepartmentID int IDENTITY(1,1) NOT NULL ,
 7     Name NVARCHAR(200) NOT NULL,
 8     GroupName NVARCHAR(200) NOT NULL,
 9     Company NVARCHAR(300),
10     ModifiedDate datetime NOT NULL  DEFAULT (getdate())
11 )
12 
13 
14 CREATE NONCLUSTERED INDEX NCL_Name_GroupName ON [dbo].[Department9](Name,[GroupName])
15 
16 DECLARE @i INT
17 SET @i=1
18 WHILE @i  1000000
19     BEGIN
20         INSERT  INTO Department9 ( name, [Company], groupname )
21         VALUES  ( '销售部'+CAST(@i AS VARCHAR(200)), '中国你好有限公司XX分公司', '销售组'+CAST(@i AS VARCHAR(200)) )
22         SET @i = @i + 1
23     END
24     
25 SELECT * FROM [dbo].[Department9]
26 
27 --TRUNCATE TABLE [dbo].[DBCCResult]
28 INSERT INTO DBCCResult EXEC ('DBCC IND(pratice,Department9,-1) ')
29 
30 SELECT * FROM [dbo].[DBCCResult] ORDER BY [PageType] DESC 
View Code

可以看到Department9表有446142行记录,因为insert插入的时间太久了,SQLSERVER没有执行完我就停止执行了,我的本本不给力啊!!

SQLSERVER聚集索引与非聚集索引的再次研究(下)

1 SELECT [GroupName] FROM [dbo].[Department9]  WHERE name= '销售部1' --索引查找
2 SELECT [GroupName] FROM [dbo].[Department9]  WHERE [GroupName]='销售组10' --索引扫描
3 SELECT [GroupName] FROM [dbo].[Department9]  WHERE [DepartmentID]=66 --全表扫描
4 SELECT [DepartmentID],[ModifiedDate] FROM [dbo].[Department9]  WHERE name= '销售部8'  --RID查找 索引查找
5 SELECT * FROM [dbo].[Department9]  WHERE [GroupName]='销售组10'  --RID查找  索引扫描

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

大家可以用《SQLSERVER聚集索引与非聚集索引的再次研究(上)》中用到的脚本来看SQLSERVER查找记录的过程中申请了什么锁来推测

查找的过程

 1 USE [pratice]
 2 GO
 3 SET TRANSACTION ISOLATION LEVEL REPEATABLE READ
 4 GO
 5 
 6 BEGIN TRAN
 7 SELECT [GroupName] FROM [dbo].[Department9]  WHERE name= '销售部1' ----替换相应的SQL语句
 8 
 9 --COMMIT TRAN--当看到结果之后要commit tran,不然锁不会释放
10 
11 USE [pratice] --要查询申请锁的数据库
12 GO
13 SELECT
14 [request_session_id],
15 c.[program_name],
16 DB_NAME(c.[dbid]) AS dbname,
17 [resource_type],
18 [request_status],
19 [request_mode],
20 [resource_description],OBJECT_NAME(p.[object_id]) AS objectname,
21 p.[index_id]
22 FROM sys.[dm_tran_locks] AS a LEFT JOIN sys.[partitions] AS p
23 ON a.[resource_associated_entity_id]=p.[hobt_id]
24 LEFT JOIN sys.[sysprocesses] AS c ON a.[request_session_id]=c.[spid]
25 WHERE c.[dbid]=DB_ID('pratice') AND a.[request_session_id]=@@SPID  ----要查询申请锁的数据库
26 ORDER BY [request_session_id],[resource_type]

其实非聚集索引查找跟聚集索引查找的原理基本上是一样的,只不过聚集索引查找根据keyhashvalue找到记录所在范围的时候还需要到数据页里找实际的记录,

因为聚集索引页的每一行记录只记录了聚集索引字段在数据页的范围

也正因为上面那个原因聚集索引扫描跟非聚集索引扫描也不一样

聚集索引扫描扫描的是数据页(原因就是上面说的:“聚集索引查找根据keyhashvalue找到记录所在范围的时候还需要到数据页里找实际的记录,

因为聚集索引页的每一行记录只记录了索引字段在数据页的范围”)

非聚集索引扫描扫描的是索引页

大家都是漫无目的地在数据页或者索引页里扫描记录

但是这里有一个问题:为什麽非聚集索引扫描没有到堆中的数据页里去扫描呢?而在索引页里扫描?

既然在索引页里扫描和在数据页里扫描大家都是漫无目的地去扫描,那么到堆中的数据页里去扫描不是更好??因为堆中的数据页包含了

记录的所有字段,而索引页只包含了创建非聚集索引时所包含的字段

因为非聚集索引扫描的前提是:where 后面要查找的字段不是建立索引时的第一个字段(不是索引查找),但是要查找的字段是包含创建非聚集索引时

的字段列中,这个字段已经保存在非聚集索引的索引页里,例子里就是GroupName列

CREATE NONCLUSTERED INDEX NCL_Name_GroupName ON [dbo].[Department9](Name,[GroupName])

又因为在一个表中索引页一般会等于或者小于数据页,所以在非聚集索引页里扫描会比堆里的数据页里

扫描的时间快,扫描的次数少(当数据量很多的时候)

-----------------------------------------------------------------------------------------------------------------------------------

SELECT [GroupName] FROM [dbo].[Department9] WHERE name= '销售部1' --索引查找

SQLSERVER聚集索引与非聚集索引的再次研究(下)

为什麽上面这条语句是索引查找,而没有RID查找?因为索引建立在GroupName和NAME上

1 CREATE NONCLUSTERED INDEX NCL_Name_GroupName ON [dbo].[Department9](Name,[GroupName])

再看一下刚才给出的非聚集索引页结构
SQLSERVER聚集索引与非聚集索引的再次研究(下)

《SQLSERVER聚集索引与非聚集索引的再次研究(上)》提到

KeyHashValue根据主键列的第一个字段而生成的,第一个字段就是NAME

就是说,这里的KeyHashValue也是创建非聚集索引时的第一个字段生成的,第一个字段是NAME

所以根据where NAME= '销售部1' hash出一个key值跟KeyHashValue匹配,而GroupName的值本来就在索引页里面,所以找到

NAME= '销售部1'的那条记录就可以收工了o(∩_∩)o 不用再到数据页里找

SELECT [GroupName] FROM [dbo].[Department9] WHERE [GroupName]='销售组10' --索引扫描

SQLSERVER聚集索引与非聚集索引的再次研究(下)

也是根据《SQLSERVER聚集索引与非聚集索引的再次研究(上)》里提到的

因为GroupName不是非聚集索引的第一个字段,所以只能用索引扫描

因为不知道key,所以SQLSERVER只能扫描所有索引页直到找到[GroupName]='销售组10',但是因为[GroupName]就存储在

索引页,所以没有RID查找

SELECT [GroupName] FROM [dbo].[Department9] WHERE [DepartmentID]=66 --全表扫描

SQLSERVER聚集索引与非聚集索引的再次研究(下)

因为DepartmentID不在非聚集索引里,所以SQLSERVER只能全表扫描

SELECT [DepartmentID],[ModifiedDate] FROM [dbo].[Department9] WHERE name= '销售部8' --RID查找 索引查找

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

因为非聚集索引不包括[DepartmentID],[ModifiedDate]这两个字段,所以SQLSERVER先索引查找,在索引页里找出name= '销售部8'的那条记录

然后根据name= '销售部8'的那条记录存储的HEAP RID(key) 值,在数据页里找到name= '销售部8' 这条记录,然后把其他字段读出来

实际上HEAP RID(key) 存储的就是指向数据页的指针,直接指向数据页里name= '销售部8' 这条记录

SELECT * FROM [dbo].[Department9] WHERE [GroupName]='销售组10' --RID查找 索引扫描

SQLSERVER聚集索引与非聚集索引的再次研究(下)

其实这条语句的前半部分查找过程跟SELECT [GroupName] FROM [dbo].[Department9] WHERE [GroupName]='销售组10' --索引扫描

这条语句是一样的,因为其他字段不在非聚集索引的索引页里,所以需要利用HEAP RID(key) 值找到记录所在的数据页然后把其他字段的值读出来

补充实验

为了验证下面这句话

因为在一个表中索引页一般会等于或者小于数据页,所以在非聚集索引页里扫描会比堆里的数据页里

扫描的时间快,扫描的次数少(当数据量很多的时候)

创建CompareNonclusteredScan表 ,CompareNonclusteredScan表跟Department9表是一样的,只是没有添加任何索引

 1 --非聚集索引扫描和全表扫描比较
 2 USE [pratice] 
 3 GO
 4 
 5 CREATE TABLE CompareNonclusteredScan(
 6     DepartmentID int IDENTITY(1,1) NOT NULL ,
 7     Name NVARCHAR(200) NOT NULL,
 8     GroupName NVARCHAR(200) NOT NULL,
 9     Company NVARCHAR(300),
10     ModifiedDate datetime NOT NULL  DEFAULT (getdate())
11 )
12 
13 
14 DECLARE @i INT
15 SET @i=1
16 WHILE @i  1000000
17     BEGIN
18         INSERT  INTO CompareNonclusteredScan ( name, [Company], groupname )
19         VALUES  ( '销售部'+CAST(@i AS VARCHAR(200)), '中国你好有限公司XX分公司', '销售组'+CAST(@i AS VARCHAR(200)) )
20         SET @i = @i + 1
21     END
22     
23 SELECT * FROM [dbo].CompareNonclusteredScan

 1 --堆表扫描统计
 2 USE [pratice]
 3 GO
 4 DBCC DROPCLEANBUFFERS
 5 GO
 6 SET STATISTICS IO ON
 7 GO
 8 SET STATISTICS TIME ON
 9 GO
10 
11 SELECT [GroupName] FROM CompareNonclusteredScan  WHERE [GroupName]='销售组10' 

 1 --非聚集索引表扫描统计
 2 USE [pratice]
 3 GO
 4 DBCC DROPCLEANBUFFERS
 5 GO
 6 SET STATISTICS IO ON
 7 GO
 8 SET STATISTICS TIME ON
 9 GO
10 
11 SELECT [GroupName] FROM [dbo].[Department9]  WHERE [GroupName]='销售组10' 

我们就比较扫描的时候,堆表和非聚集索引表 所用IO 和所用时间的情况
Department9表的统计情况

1 SQL Server 分析和编译时间: 
2    CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
3 
4 (1 行受影响)
5'Department9'。扫描计数 1,逻辑读取 4313 次,物理读取 3 次,预读 4304 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
6 
7 SQL Server 执行时间:
8    CPU 时间 = 219 毫秒,占用时间 = 1593 毫秒。

CompareNonclusteredScan表的统计情况

1 SQL Server 分析和编译时间: 
2    CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
3 
4 (1 行受影响)
5'CompareNonclusteredScan'。扫描计数 5,逻辑读取 8766 次,物理读取 0 次,预读 8756 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
6 
7 SQL Server 执行时间:
8    CPU 时间 = 296 毫秒,占用时间 = 1059 毫秒。

当我不执行DBCC DROPCLEANBUFFERS 不清空缓存

1 SQL Server 分析和编译时间: 
2    CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
3 
4 (1 行受影响)
5'Department9'。扫描计数 1,逻辑读取 4313 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
6 
7 SQL Server 执行时间:
8    CPU 时间 = 78 毫秒,占用时间 = 73 毫秒。

1 SQL Server 分析和编译时间: 
2    CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
3 
4 (1 行受影响)
5'CompareNonclusteredScan'。扫描计数 5,逻辑读取 8766 次,物理读取 0 次,预读 8756 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
6 
7 SQL Server 执行时间:
8    CPU 时间 = 250 毫秒,占用时间 = 995 毫秒。

为什麽逻辑读的次数、扫描的次数 、占用时间会相差这麽多??

其实原因很简单

一般在一张表里面索引页面都会比数据页面少,比如一个表有100行记录,非聚集索引页面用一个页面就装下100行记录

数据页面一个页面只能装下50个,需要用两个数据页才能装得下所有数据

如下图,一个只有非聚集索引的表,数据页面有11个,非聚集索引页面有9个

SQLSERVER聚集索引与非聚集索引的再次研究(下)

如果要找一行记录,如果扫描数据页可能要扫描到第二页才能找到那条记录,如果扫描非聚集索引页,只需要扫描一个非聚集索引页就可以了

先读取非聚集索引页面(逻辑读取)-》再扫描非聚集索引页面(扫描计数)

所以逻辑读取、扫描计数、占用时间跟堆表相差这麽大的原因就是这个

还有下面这个SQL语句也是索引扫描,不加where 筛选条件,因为GroupName包含在非聚集索引中,所以扫描非聚集索引页面比扫描数据页面的效率高

1 SELECT [GroupName] FROM [dbo].[Department9]    --索引扫描

SQLSERVER聚集索引与非聚集索引的再次研究(下)


现在大家可以看出来扫描索引页和扫描数据页的优势了吧??

那么非聚集索引是不是一定会扫描非聚集索引页呢(当数据量很少的时候)???

在有聚集索引的表里,只插入少量记录,表中是不会产生聚集索引页的,因为聚集索引扫描是扫描数据页不会扫描聚集索引页

那么非聚集索引会不会跟聚集索引一样呢??

先drop掉Department9表,然后重新建立Department9表,建表脚本跟刚才一样,只插入5条记录

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

结果还是会生成非聚集索引页,就是说无论什么情况,非聚集索引只会扫描非聚集索引页

-------------------------------------------华丽的分割线------------------------------------------------------

覆盖索引 INCLUDE()

覆盖索引只能建立在非聚集索引上,那么覆盖索引是怎样的呢?

建立Department10表

 1 --覆盖索引
 2 USE [pratice] 
 3 GO
 4 DROP TABLE [dbo].[Department10]
 5 CREATE TABLE Department10(
 6     DepartmentID int IDENTITY(1,1) NOT NULL ,
 7     Name NVARCHAR(200) NOT NULL,
 8     GroupName NVARCHAR(200) NOT NULL,
 9     Company NVARCHAR(300),
10     ModifiedDate datetime NOT NULL  DEFAULT (getdate())
11 )
12 
13 
14 CREATE  INDEX NCL_Name_GroupName ON [dbo].[Department10](Name,[GroupName]) INCLUDE(ModifiedDate)
15 
16 
17 DECLARE @i INT
18 SET @i=1
19 WHILE @i  10000
20     BEGIN
21         INSERT  INTO Department10( name, [Company], groupname )
22         VALUES  ( '销售部'+CAST(@i AS VARCHAR(200)), '中国你好有限公司XX分公司', '销售组'+CAST(@i AS VARCHAR(200)) )
23         SET @i = @i + 1
24         WAITFOR DELAY '00:00:00:100'
25     END
26     
27 SELECT * FROM [dbo].[Department10]
28 
29 --TRUNCATE TABLE [dbo].[DBCCResult]
30 INSERT INTO DBCCResult EXEC ('DBCC IND(pratice,Department10,-1) ')
31 
32 SELECT * FROM [dbo].[DBCCResult] ORDER BY [PageType] DESC 

查看一下索引页14549

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

你会发现覆盖索引跟非聚集索引的索引页结构是一样的,只不过多了ModifiedDate列,但是ModifiedDate列没有在旁边加上(key)

大家注意看

SQLSERVER聚集索引与非聚集索引的再次研究(下)

那么既然覆盖索引只是在索引页加上一个字段,那么倒不如创建非聚集索引的时候,把ModifiedDate列也纳入到非聚集索引中

1 CREATE  INDEX NCL_Name_GroupName ON [dbo].[Department10](Name,[GroupName],[ModifiedDate]) 

究竟覆盖索引有什么存在的价值呢???
我们看一下MSDN的解释

http://msdn.microsoft.com/zh-cn/library/ms190806(SQL.90).aspx

大家注意看里面其中一句话

SQLSERVER聚集索引与非聚集索引的再次研究(下)

看了MSND的介绍,本人觉得覆盖索引最大的优势是突破了索引列大小的限制,将尽可能多的列(字段)放到索引页,

这样查询数据的时候就可以尽量使用索引扫描而不用RID查找或全表扫描,覆盖索引其他特别的用途或者特点或者优势就找不到了

还有MSDN里面提到“只能对表或索引视图的非聚集索引定义非键列”,为什麽聚集索引不能使用覆盖索引??

不知道大家有没有留意到本人在上面说到的一句话

其实非聚集索引查找跟聚集索引查找的原理基本上是一样的,只不过聚集索引查找根据keyhashvalue找到记录所在范围的时候还需要到数据页里找实际的记录,

因为聚集索引页的每一行记录只记录了索引字段在数据页的范围

也正因为上面那个原因聚集索引扫描跟非聚集索引扫描也不一样

聚集索引扫描扫描的是数据页(原因就是上面说的:“聚集索引查找根据keyhashvalue找到记录所在范围的时候还需要到数据页里找实际的记录,

因为聚集索引页的每一行记录只记录了索引字段在数据页的范围”)

非聚集索引扫描扫描的是索引页

如果聚集索引扫描的是数据页,那么就算你把覆盖索引加到聚集索引的索引页也没有用,因为SQLSERVER使用聚集索引扫描的时候扫描的

是数据页而不像非聚集索引那样扫描的是索引页

SQLSERVER聚集索引与非聚集索引的再次研究(下)

--------------------------------------------------华丽的分割线-------------------------------------------------------

聚集索引和非聚集索引并存

SQLSERVER聚集索引与非聚集索引的再次研究(下)

 1 --非聚集索引和聚集索引
 2 USE [pratice] 
 3 GO
 4 
 5 CREATE TABLE Department11(
 6     DepartmentID int IDENTITY(1,1) NOT NULL PRIMARY KEY,
 7     Name NVARCHAR(200) NOT NULL,
 8     GroupName NVARCHAR(200) NOT NULL,
 9     Company NVARCHAR(300),
10     ModifiedDate datetime NOT NULL  DEFAULT (getdate())
11 )
12 
13 CREATE NONCLUSTERED  INDEX NCL_Name_GroupName ON [dbo].[Department11](Name,[GroupName])
14 
15 DECLARE @i INT
16 SET @i=1
17 WHILE @i  1000
18     BEGIN
19         INSERT  INTO Department11( name, [Company], groupname )
20         VALUES  ( '销售部'+CAST(@i AS VARCHAR(200)), '中国你好有限公司XX分公司', '销售组'+CAST(@i AS VARCHAR(200)) )
21         SET @i = @i + 1
22     END
23     
24 SELECT * FROM [dbo].[Department11]
25 
26 --TRUNCATE TABLE [dbo].[DBCCResult]
27 INSERT INTO DBCCResult EXEC ('DBCC IND(pratice,Department11,-1) ')
28 
29 SELECT * FROM [dbo].[DBCCResult] ORDER BY [PageType] DESC 

SQLSERVER聚集索引与非聚集索引的再次研究(下)

先来看一下非聚集索引页,可以看到非聚集索引中多了一个字段就是建立聚集索引时的第一个字段DepartmentID

SQLSERVER聚集索引与非聚集索引的再次研究(下)

再来看聚集索引页

SQLSERVER聚集索引与非聚集索引的再次研究(下)

MSDN中的解释:http://msdn.microsoft.com/zh-cn/library/ms177484(v=SQL.105).aspx

如果表有聚集索引或索引视图上有聚集索引,则行定位器是行的聚集索引键。

如果聚集索引不是唯一的索引,SQL Server 将添加在内部生成的值(称为唯一值)以使所有重复键唯一。

此四字节的值对于用户不可见。仅当需要使聚集键唯一以用于非聚集索引中时,才添加该值。

SQL Server 通过使用存储在非聚集索引的叶行内的聚集索引键搜索聚集索引来检索数据行

根据MSDN的解释,实际上相当于在非聚集索引上建立多一个字段,而这个字段就是联系聚集索引和非聚集索引的桥梁

1 CREATE NONCLUSTERED  INDEX NCL_Name_GroupName ON [dbo].[Department11](Name,[GroupName],[DepartmentID])

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

那么当要查询的字段不在非聚集索引的索引页的时候,那么就要到聚集索引的叶子节点(数据页)去找记录,那么这个查找记录的过程是怎样的呢?

这个查找记录的过程实际上就是“书签查找”,在本文章的下面会讲到

-------------------------------------------------华丽的分割线-------------------------------------------------------------

网上有人说,只有堆表才有IAM页,并且IAM页面维护着数据页的前后顺序,那么索引页是不是就没有IAM页维护索引页面的前后顺序呢?

有索引的表的数据页有没有IAM页来维护数据页的前后顺序呢?

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

MSDN中的解释:

http://msdn.microsoft.com/zh-cn/library/ms189051%28SQL.90%29.aspx

表、索引或索引视图分区的页分配由一个 IAM 页链管理。sys.system_internals_allocation_units 中的 first_iam_page 列指向 IAM 页链(用于管理分配给 IN_ROW_DATA 分配单元中的表、索引或索引视图的空间)中的第一个 IAM 页。
sys.partitions 为表或索引中每个分区返回一行。
堆在 sys.partitions 中有一行,其 index_id = 0。
sys.system_internals_allocation_units 中的 first_iam_page 列指向指定分区中堆数据页集合的 IAM 链。服务器使用 IAM 页查找数据页集合中的页,因为这些页没有链接。
表或视图的聚集索引在 sys.partitions 中有一行,其 index_id = 1。
sys.system_internals_allocation_units 中的 root_page 列指向指定分区内聚集索引 B 树的顶端。服务器使用索引 B 树查找分区中的数据页。
为表或视图创建的每个非聚集索引在 sys.partitions 中有一行,其 index_id > 1。
sys.system_internals_allocation_units 中的 root_page 列指向指定分区内非聚集索引 B 树的顶端。
至少有一个 LOB 列的每个表在 sys.partitions 中也有一行,其 index_id > 250。
first_iam_page 列指向管理 LOB_DATA 分配单元中的页的 IAM 页链。

再说明一下在DBCC IND的结果中PageType 字段和IndexID字段的含义

PageType 分页类型: 1:数据页面;2:索引页面;3:Lob_mixed_page;4:Lob_tree_page;10:IAM页面

IndexID 索引ID: 0 代表堆, 1 代表聚集索引, 2-250 代表非聚集索引 ,大于250就是text或image字段

-------------------------------------------------------华丽的分割线----------------------------------------------------

书签查找 BookMark Lookup

建立Department12表

 1 --非聚集索引和聚集索引  书签查找
 2 USE [pratice] 
 3 GO
 4 
 5 CREATE TABLE Department12(
 6     DepartmentID int IDENTITY(1,1) NOT NULL PRIMARY KEY,
 7     Name NVARCHAR(200) NOT NULL,
 8     GroupName NVARCHAR(200) NOT NULL,
 9     Company NVARCHAR(300),
10     ModifiedDate datetime NOT NULL  DEFAULT (getdate())
11 )
12 
13 CREATE NONCLUSTERED  INDEX NCL_Name_GroupName ON [dbo].[Department12](Name)
14 
15 DECLARE @i INT
16 SET @i=1
17 WHILE @i  10000
18     BEGIN
19         INSERT  INTO Department12( name, [Company], groupname )
20         VALUES  ( '销售部'+CAST(@i AS VARCHAR(200)), '中国你好有限公司XX分公司', '销售组'+CAST(@i AS VARCHAR(200)) )
21         SET @i = @i + 1
22     END
23     
24 SELECT * FROM [dbo].[Department12]
25 
26 --TRUNCATE TABLE [dbo].[DBCCResult]
27 INSERT INTO DBCCResult EXEC ('DBCC IND(pratice,Department12,-1) ')
28 
29 SELECT * FROM [dbo].[DBCCResult] ORDER BY [PageType] DESC 

书签查找的主体是“非聚集索引”

所以书签查找只会出现在下面两种表中:

(1)只有非聚集索引的表

(2)聚集索引和非聚集索引并存的表

而只有聚集索引的表是不会出现书签查找的

为什麽非聚集索引才会出现书签查找???

大家可以再看一下非聚集索引的结构图和MSDN的定义

SQLSERVER聚集索引与非聚集索引的再次研究(下)

SQLSERVER聚集索引与非聚集索引的再次研究(下)

而书签查找的定义:

MSDN定义:

定义:当查询优化器使用非聚集索引进行查找时,如果所选择的列或查询条件中的列只部分包含在使用的非聚集索引和聚集索引中时,就需要一个查找(lookup)来检索其他字段来满足请求。对一个有聚簇索引的表来说是一个键查找(key lookup),对一个堆表来说是一个RID查找(RID lookup),这种查找即是——书签查找(bookmark lookup)。简单的说就是当你使用的sql查询条件和select返回的列没有完全包含在索引列中时就会发生书签查找

因为无论是(1)只有非聚集索引的表 还是(2)聚集索引和非聚集索引并存的表 数据页都不是非聚集索引的一部分

所以如果所查找的数据不在非聚集索引的索引页就需要到数据页去取数据,这种情况就叫“书签查找”

其实数据表里的数据就像书本里的内容,而非聚集索引就像书签,因为书本里的内容不可能全部在书签里,但是要找到书本里的内容需要书签去定位

其实简单来讲,就四种情况:

我们再回到Department9表

第一种

1 SELECT [DepartmentID],[ModifiedDate] FROM [dbo].[Department9]  WHERE name= '销售部8'  --RID查找 索引查找


前面说到的:

因为非聚集索引不包括[DepartmentID],[ModifiedDate]这两个字段,所以SQLSERVER先索引查找,在索引页里找出name= '销售部8'的那条记录

然后根据name= '销售部8'的那条记录存储的HEAP RID(key) 值,在数据页里找到name= '销售部8' 这条记录,然后把其他字段读出来

实际上HEAP RID(key) 存储的就是指向数据页的指针,直接指向数据页里name= '销售部8' 这条记录

第二种

1 SELECT * FROM [dbo].[Department9]  WHERE [GroupName]='销售组10'  --RID查找  索引扫描

前面说到的:

其实这条语句的前半部分查找过程跟SELECT [GroupName] FROM [dbo].[Department9] WHERE [GroupName]='销售组10' --索引扫描

这条语句是一样的,因为其他字段不在非聚集索引的索引页里,所以需要利用HEAP RID(key) 值找到记录所在的数据页然后把其他字段的值读出来

第三种

我们先建立Department13表 ,Department13表和Department11表的表结构是一样的

不过在Department13表里添加了1000000条记录,因为记录不够多(数据量很少)会走聚集索引扫描

 1 --非聚集索引和聚集索引
 2 USE [pratice] 
 3 GO
 4 
 5 CREATE TABLE Department13(
 6     DepartmentID int IDENTITY(1,1) NOT NULL PRIMARY KEY,
 7     Name NVARCHAR(200) NOT NULL,
 8     GroupName NVARCHAR(200) NOT NULL,
 9     Company NVARCHAR(300),
10     ModifiedDate datetime NOT NULL  DEFAULT (getdate())
11 )
12 
13 CREATE NONCLUSTERED  INDEX NCL_Name_GroupName ON [dbo].[Department13](Name,[GroupName])
14 
15 DECLARE @i INT
16 SET @i=1
17 WHILE @i  1000000
18     BEGIN
19         INSERT  INTO Department13( name, [Company], groupname )
20         VALUES  ( '销售部'+CAST(@i AS VARCHAR(200)), '中国你好有限公司XX分公司', '销售组'+CAST(@i AS VARCHAR(200)) )
21         SET @i = @i + 1
22     END
23     
24 SELECT * FROM [dbo].[Department13]

1 SELECT [ModifiedDate] FROM [Department13] WHERE GroupName='销售组168'  --索引扫描  键查找 并行

SQLSERVER聚集索引与非聚集索引的再次研究(下)

那么第三种情况的查找过程是怎样的??

先用之前用到的测试语句测试一下用了什么锁

 1 USE [pratice]
 2 GO
 3 SET TRANSACTION ISOLATION LEVEL REPEATABLE READ
 4 GO
 5 
 6 BEGIN TRAN
 7 SELECT [ModifiedDate] FROM [Department13] WHERE GroupName='销售组168'  --索引扫描  键查找 并行
 8 
 9 --COMMIT TRAN
10 
11 USE [pratice] --要查询申请锁的数据库
12 GO
13 SELECT
14 [request_session_id],
15 c.[program_name],
16 DB_NAME(c.[dbid]) AS dbname,
17 [resource_type],
18 [request_status],
SQLSERVER聚集索引与非聚集索引的再次研究(下)

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。