mysql 存储引擎InnoDB — 索引

程序员文章站 2022-05-08 16:02:14

...

mysql 存储引擎Innodb — 索引

一、索引类型
二、组合索引
三、其他

简介：
索引可以包含一个或多个列的值。如果索引包含多个列，那么列的顺序也十分重要。MySQL只能高效地使用索引的最左前缀列。下面会有详细的介绍。
大家都知道索引能让服务器快速定位到表的指定位置，但这不是索引的唯一作用。使用索引有如下三大优点：

索引大大减少了服务器需要扫描的数据量。
索引可以帮助服务器避免排序和临时表。
索引可以讲随机I/O变为顺序IO。

一、索引类型

1. B+树索引（btree索引)
B+树索引是最为常用的，也是最有效的索引。B+树最早是从平衡二叉树演化过来的，但不是二叉树。B+树通常意味着所有的值都是按顺序存储的，并且每个叶子页到根的距离相同。
注意：B+树索引不能找到一个给定值的具体行，只能找到被查找数据行所在的页。数据库把页读到内存，在内存中搜索需要查找的数据。

下图展示了b+树索引的抽象表示（图片来源：高性能mysql第三版）：
mysql 存储引擎InnoDB — 索引

B+树索引分为两种：

聚集索引
按照每张表的主键构造一颗B+树，叶子节点存放整张表的行记录数据，也将聚集索引的叶子节点成为数据页。
辅助索引
辅助索引也称非聚集索引，叶子节点不包含行记录的全部数据，每个节点包含一个书签（bookmark）,该书签存储了相应行数据的聚集索引键。

2. hash索引
InnoDB支持的hash索引是自适应的(自适应哈希索引,Adaptive Hash Index, AHI)，InnoDB会根据表的使用情况，自动为表生成hash索引，不能人为干预。
hash索引只能用于等值查询，例如：select x from xxxx where xx = xxx, 其他查询不支持（比如：where xx > xxx）

# 查看当前hash索引使用情况
show engine innodb status
# 查看AHI是否启用 默认启用ON,如若想关闭，将ON改为OFF
show variables like 'innodb_adaptive_hash_index'

3. 全文索引
全文索引是一种特殊类型的索引，它查找的是文本中的关键词，而不是直接比较索引中的值。MySQL5.6以后，innodb支持全文索引
在相同列上同时创建全文索引和B+树索引不会有冲突，适用于Match Against操作，而不是普通的where条件操作。

使用全文索引

    # 创建文章表，指定使用InnoDB引擎，title、content添加全文索引
    CREATE TABLE articles (
        id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
        title VARCHAR(200),
        content TEXT,
        FULLTEXT (title,content)
    ) ENGINE=InnoDB CHARACTER SET utf8mb4;

    # 插入十万条数据（测试全文索引查询效率，多插点数据。这里使用存储函数）
    # 对存储过程不熟悉的，可以看下我另一篇博客
    # https://blog.csdn.net/hhy107107/article/details/81269946
    delimiter ;;
    CREATE procedure insert_more ()
    BEGIN
    DECLARE i int DEFAULT 1;
    WHILE i < 100000
    DO
    INSERT INTO articles(id, title, content) values (null, 'title', REPEAT('content',7000));
    SET i = i + 1;
    END WHILE;
    COMMIT;
    END;;
    delimiter ;
    
    # 执行插入
    call insert_more
    
    # 随便往其中一条记录的content字段的内容中加测试两个字

    # 普通查询，不走索引
    [SQL] SELECT * FROM articles WHERE content like '%测试%'
    受影响的行: 0
    时间: 44.967s
    
    # 使用全文索引
    [SQL] SELECT * FROM articles WHERE MATCH (title,content) AGAINST ('测试' IN boolean MODE);
    受影响的行: 0
    时间: 0.195s

二、组合索引

组合索引一个索引包含多个列

现有一个people表, 有一个组合索引，包含三个列

create table people (
    last_name varchar(50) not null,
    first_name varchar(50) not null,
    dob date not null,
    gender enum('m', 'f') not null,
    key(last_name, first_name, dob)
)

上表建的索引，对如下类型的查询有效

全值匹配
可以用于查找姓xx,名xx,出生于xx的人
匹配最左前缀
可以用于查找姓xx的人，即只使用索引的第一列
匹配列前缀
可以匹配某一列的值的开头部分。例如可以查找姓氏为X头的人
匹配范围值
可以查找姓X和XX之间的人
精确匹配某一列并范围匹配另外一列
可以匹配姓X名字X开头的人，即last_name 全匹配，first_name 范围匹配
只访问索引的查询
查询只需要访问索引，无需访问数据行

索引查询的限制

如果不是从索引的最左列开始查找，不能使用索引。
例如，上表不能用索引查询first_name为x的人，也不能查出生于X的人。因为这两列不是最左数据列。也无法查询姓氏以X结尾的人。
不能跳列索引
也就是说不能查询姓X，出生于XX的人，如果不指定名，只能索引姓，不能索引出生日期。
如果查询的某个列是范围查询，其右边的列无法索引。
例如，where last_name = 'x' and first_name like 'J%' and dob = 'xx' 这个查询，只能索引last_name和first_name,不能索引dob

三、其他

1.索引设计原则

最适合建索引的列是where子句后面的列和连接子句中指定的列。
使用唯一索引。考虑某列中值的分布。对于唯一值的列，索引效果最好，具有多个重复值的列，索引效果最差。比如记录性别的列，此列值只有‘M’，‘F’，对此列索引没多大用，不管搜哪个，都回得出大约一半的行。
使用短索引。例如有个char(200)的列，列值前10的值多数都是唯一的，那么就不要对整列进行索引，只对列的前10个字符索引

2.不能使用索引的情况

如果mysql查询的列不是独立的，不能使用索引。索引列不能是表达式的一部分，也不能是函数的参数。
例如：select user_id from user where user_id + 1 = 5;

3.索引提示
mysql 支持索引提示（index hint），显式的告诉优化器使用哪个索引。
当某条sql语句可以选择的索引非常多，优化器选择执行计划的时间开销可能会比较大。这时候，我们可以强制让优化器不进行执行路径的成本分析，直接使用指定的索引进行查询

# 指定使用firstName索引 firstName是索引名称
SELECT * FROM `user` force index (firstName) WHERE last_name = '姓氏' and first_name = '名字';

# 使用explain关键字查看执行计划  结果中，possible_keys为可选择的索引， key表示当前使用的索引
explain SELECT * FROM `user` force index (firstName) WHERE last_name = '姓氏' and first_name = '名字';

Mysql InnoDB介绍
https://blog.csdn.net/hhy107107/article/details/82703926

MySQL 存储过程
https://blog.csdn.net/hhy107107/article/details/81269946

[1]姜承尧 .MySQL技术内幕：InnoDB存储引擎机械工业出版社
[2]高性能MySQL 第三版：电子工业出版社

上一篇： mysql允许外网访问配置

下一篇： MongoDB的安装配置

mysql 存储引擎InnoDB — 索引