欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

MySQL索引 - 索引的类型

程序员文章站 2022-06-24 09:27:36
索引的类型 B-Tree索引 B-Tree 索引 通常意味着所有的值都是按顺序存储的,并且每一个叶子页到根的距离相同。 B-Tree 索引 能够加快访问数据的速度,存储引擎不再需要进行全表扫描来获取需要的数据,取而代之的是从索引的根节点开始搜索。 B-Tree 索引 适用于全键值、键值范围或键前缀查 ......
索引的类型 B-Tree索引 B-Tree 索引 通常意味着所有的值都是按顺序存储的,并且每一个叶子页到根的距离相同。 B-Tree 索引 能够加快访问数据的速度,存储引擎不再需要进行全表扫描来获取需要的数据,取而代之的是从索引的根节点开始搜索。 B-Tree 索引 适用于全键值、键值范围或键前缀查找(最左前缀原则)。 哈希索引 哈希索引 基于哈希表实现,只有精确匹配索引所有列的查询才有效。 哈希索引 是Memory引擎表的默认索引类型,但Memory同时也支持B-Tree索引。 哈希索引 自身只需存储对应的哈希值和行指针,而不存储字段值,所以索引的结构十分紧凑,这也让哈希索引查找的速度非常快。 哈希索引 数据并不是按照索引值顺序存储的,所以无法用于排序。 哈希索引 不支持部分索引列匹配查找,因为哈希索引始终是使用索引列的全部内容来计算哈希值的。例如数据列(A,B)上建立索引,如果查询只有数据列A,则无法使用该索引。 哈希索引 不支持任何范围查询,如WHERE score > 60。 哈希索引 只支持等值比较查询,包括=、IN()、<=>(注意<>和<=>是不同的操作)。 介绍一个使用场景:如需要存储大量的URL,并需要根据URL进行搜索查找。如果使用B-Tree来存储URL,存储的内容就会非常大,因为URL本身很长。 创建表
1 mysql> CREATE TABLE TB3 (
2     -> id INT UNSIGNED NOT NULL AUTO_INCREMENT,
3     -> url VARCHAR(255) NOT NULL,
4     -> url_crc INT UNSIGNED NOT NULL DEFAULT 0,
5     -> PRIMARY KEY(id),
6 -> KEY IDX(url_crc) 7 -> );
创建触发器
mysql> DELIMITER //
mysql> CREATE TRIGGER TB3_CRC_INS BEFORE INSERT ON TB3 FOR EACH ROW BEGIN SET NEW.url_crc=CRC32(NEW.url);
-> END;
-> // mysql> CREATE TRIGGER TB3_CRC_UPD BEFORE UPDATE ON TB3 FOR EACH ROW BEGIN SET NEW.url_crc=CRC32(NEW.url);
-> END;
-> // mysql> DELIMITER ;
插入或更新数据
 1 mysql> INSERT INTO TB3(url) VALUES('http://www.mysql.com');
 2 mysql> SELECT * FROM TB3;
 3 +----+----------------------+------------+
 4 | id | url                  | url_crc    |
 5 +----+----------------------+------------+
 6 |  1 | http://www.mysql.com | 1560514994 |
 7 +----+----------------------+------------+
 8 
 9 mysql> UPDATE TB3 SET url="https://www.mysql.com" WHERE id=1;
10 mysql> SELECT * FROM TB3;
11 +----+-----------------------+------------+
12 | id | url                   | url_crc    |
13 +----+-----------------------+------------+
14 |  1 | https://www.mysql.com | 1053537447 |
15 +----+-----------------------+------------+
查询(可以看出ref: const,已经是最好的级别了),有同学问为什么在WHERE条件中不直接使用一个url_crc作为筛选条件,因为一旦出现哈希冲突,另一个字符串的哈希值也恰好一样的时候,只是用url_crc来来查询是无法工作的,所以要避免冲突问题,必须在WHERE中带入哈希值和对应的列值。
 1 mysql> EXPLAIN SELECT * FROM TB3 WHERE url_crc=CRC32('https://www.mysql.com') AND url="https://www.mysql.com"\G
 2 *************************** 1. row ***************************
 3            id: 1
 4   select_type: SIMPLE
 5         table: TB3
 6    partitions: NULL
 7          type: ref
 8 possible_keys: IDX
 9           key: IDX
10       key_len: 4
11           ref: const
12          rows: 1
13      filtered: 100.00
14         Extra: Using where

PS:如果采用这种方式,不要使用SHA1()和MD5()作为哈希函数,因为这两个函数计算出来的哈希值是非常长的字符串,会浪费大量空间,比较时也会更慢。 但如果数据表非常大,CRC32会出现大量的哈希冲突,可以自己实现一个简单的64位哈希函数,如SELECT CONV(RIGHT(MD5("https://www.mysql.com"), 16), 16, 10) AS HASH64;

空间数据索引  MyISAM表支持空间索引,可以用作地理数据存储。  MySQL的GIS支持并不完善,所以大部分人都不会使用该特性。  空间索引会从所有维度来索引数据,和B-Tree不同,这类索引无须前缀查询。  必须使用MySQL的GIS相关函数如MBRCONTAINS()等来维护数据。 全文索引  全文索引是一种特殊类型的索引,它查找的是文本中的关键词,而不是直接比较索引中的值。  全文索引使用与MATCH AGAINST操作,而不是普通的WHERE条件操作。 其他索引  TokuDB 使用分形树索引,既有B-Tree的很多优点,又避免了B-Tree的一些缺点。  ScaleDB 使用Patricia tries。  InfiniDB 和 Infobright 使用了一些特殊的数据结构来优化某些特殊的查询。