欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

表、索引相关知识及其在数据库内部相关的物理存储

程序员文章站 2022-05-19 12:59:31
...

1. 数据库中最小的物理存储单位:块(block) 数据库最小的物理存储单位是块(9i、10g默认是8k),每个块一般只属于一个表;一行数据插入时会占用块中的一些存储,当块不能再容纳新数据时,则将启用新的块存储数据; 2. 表数据在块中的存储以及RowId信息 表的

1. 数据库中最小的物理存储单位:块(block)

数据库最小的物理存储单位是块(9i、10g默认是8k),每个块一般只属于一个表;一行数据插入时会占用块中的一些存储,当块不能再容纳新数据时,则将启用新的块存储数据;

2. 表数据在块中的存储以及RowId信息

表的字段除了设计者设计的字段外,还有个伪列Rowid;RowId是oracle每个表记录的位置信息。当表中插入一行记录时,此记录的块就有一个唯一的物理位置,这个位置信息在查询记录时显示为RowId伪列;

3. 索引

普通表中记录的存储顺序是没有规律的,在一个数据量很大的表中,如果不引入其他的手段,每次查找小部分记录都是从第一条扫描到最后一条,这样,系统将慢得不能使用;使用索引可以有效解决问题;

索引的本质用途是通过它使读取进程在扫描源表时的数据块范围大大减小了,因此性能大幅度提高;

一般情况下,当检索的记录与所有记录数比较

当索引建好后,oracle优化器在执行sql时会选择是否使用索引,所以设计表者不用担心此索引会影响检索性能;

创建索引的标准是那一列是否经常在where条件中出现,否则不应该建立,因为,每次表记录的增加、删除以及修改那个字段值时,还要维护索引,增加了开销;

此节讲的索引叫B_tree索引,在内部存储中类似树状结构,有枝和叶,枝是oracle内部存储的一些连接数据,叶才存储实际的值,
表中每条记录只要那个列是非NULL值,在索引中都有一个条目(entry)来存储,类似于表在块中一条条记录存储

4. Bitmap索引介绍

当表中某列的distinct值比较少时,使用B_tree索引效率就不高了,因为以此列来做where条件过滤的话,结果集很可能超过总记录数的4%,正如前面说过的,超过4%记录使用B_tree索引,效率反而下降。使用Bitmap位图索引可以解决这个问题;
Bitmap索引使用一个位图来记录数据情况,举例:
商品表product,有一个字段color存储颜色值,在所有商品中最多就10种不同的颜色,创建的位图图示如下:

其中,Start ROWID是表中的第一条记录的物理地址,end ROWID是表中最后一条记录的物理地址,bitmap是一张位图,存储一连串的0或1;
列值为blue的bitmap中,每个bit的位置在源表中都能找到某个位置与它一一对应,它们在各自对象中的相对位置一样。bit值为1时,则源表对应位置那个rowid所在的记录的color字段值为‘blue’,为0时,则非‘blue’值;类似的,Green,Red,Yellow都有各自的bitmap;
试想,当where条件中有过滤条件A and B,条件A可以使用B_tree索引,条件B可以使用bitmap索引,那么从A条件中可以得到一个RowId的集合,从B条件也可以得到RowId结合,这样,只要从第一个rowid集中去除第二个rowid集中的值,得到结果集Rowid,我们就可以从源表得到数据了;
Bitmap使用了压缩技术,节约了存储,并且在一个bitmap上对某个位bit的值是1还是0时速度是非常快的;

5. 反向索引

反向索引就是将正常的键值头尾调换后再进行存储,比如原值是“1234”,将会以“4321”形式进行存储,这样做可以高效地打散正常的索引键值在索引叶块中的分布 位置。

6. 索引分区

有两种类型的分区索引,全局索引和本地索引,其中本地索引又可以分为本地前缀索引和本地非前缀索引。
全局索引 全局索引以整个表的数据为对象建立索引,索引分区中的索引条目既可能是基于相同的键值但是来自不同的分区,也可能是多个不同键值的组合。
全局索引既允许索引分区的键值和表分区键值相同,也可以不相同。全局索引和表之间没有直接的联系,这一点和本地索引不同。
全局索引和表没有直接的关联,必须显式的指定maxvalue值。假如表中新加了分区,不会在全局索引中自动增加新的分区,必须手工添加相应的分区。
使用全局索引,索引键值必须和分区键值相同,这就是所谓的前缀索引。Oracle不支持非前缀的全局分区索引,如果需要建立非前缀分区索引,索引必须建成本地索引。
本地索引 本地索引的分区和其对应的表分区数量相等,因此每个表分区都对应着相应的索引分区。使用本地索引,不需要指定分区范围因为索引对于表而言是本地的,当本地索引创建时,Oracle会自动为表中的每个分区创建独立的索引分区。
创建本地索引不必显式的指定maxvalue值,因为为表新添加表分区时,会自动添加相应的索引分区。