MySQL执行计划的深入分析
前言
在之前的面试过程中,问到执行计划,有很多童鞋不知道是什么?甚至将执行计划与执行时间认为是同一个概念。今天我们就一起来了解一下执行计划到底是什么?有什么用途?
执行计划是什么?
执行计划,简单的来说,是sql在数据库中执行时的表现情况,通常用于sql性能分析,优化等场景。
一. 执行计划能告诉我们什么?
- sql如何使用索引
- 联接查询的执行顺序
- 查询扫描的数据函数
二. 执行计划中的内容
sql执行计划的输出可能为多行,每一行代表对一个数据库对象的操作
1. id列
- id列中的如果数据为一组数字,表示执行select语句的顺序;如果为null,则说明这一行数据是由另外两个sql语句进行 union操作后产生的结果集
- id值相同时,说明sql执行顺序是按照显示的从上至下执行的
- id值不同时,id值越大代表优先级越高,则越先被执行
演示
可以看到上面的执行计划返回了3行结果,id列的值可以看作是sql中所具有的select操作的序号
由于上述sql中只有一个select,所以id全为1,因此,我们就要按照由上至下读取执行计划
按照我们的sql语句,我们会认为执行顺序是a,b,c,但是通过上图可以发现,mysql并不是完成按照sql中所写的顺序来进行表的关联操作的
执行对表的执行顺序为a,c,b,这是由于mysql优化器会根据表中的索引的统计信息来调整表关联的实际顺序
2. select_type列
值 | 含义 |
---|---|
simple | 不包含子查询或是union操作的查询 |
primary | 查询中如果包含任何子查询,那么最外层的查询则被标记为primary |
subquery | select 列表中的子查询 |
dependent subquery | 依赖外部结果的子查询 |
union | union操作的第二个或是之后的查询的值为union |
dependent union | 当union作为子查询时,第二或是第二个后的查询的select_type值 |
union result | union产生的结果集 |
derived | 出现在from子句中的子查询 |
3. table列
包含以下几种结果:
输出去数据行所在表的名称,如果表取了别名,则显示的是别名
<union m,n>: 由id为m,n查询union产生的结果集
<derived n>/<subquery n> :由id为n的查询产生的结果
4. partitions列:
查询匹配的记录来自哪一个分区
对于分区表,显示查询的分区id
对于非分区表,显示为null
5. type列
按性能从高至低排列如下:
值 | 含义 |
---|---|
system | 这是const联接类型的一个特例,当查询的表只有一行时使用 |
const | 表中有且只有一个匹配的行时使用,如对主键或是唯一索引的查询,这是效率最高的联接方式 |
eq_ref | 唯一索引或主键索引查询,对应每个索引键,表中只有一条记录与之匹配 |
ref | 非唯一索引查找,返回匹配某个单独值的所有行 |
ref_or_null | 类似于ref类型的查询,但是附加了对null值列的查询 |
index_merge | 该联接类型表示使用了索引合并优化方法 |
range | 索引范围扫描,常见于between、>、<这样的查询条件 |
index | full index scan 全索引扫描,同all的区别是,遍历的是索引树 |
all | full table scan 全表扫描,这是效率最差的联接方式 |
6. extra列
包含mysql如何执行查询的附加信息
值 | 含义 |
---|---|
distinct | 优化distinct操作,在找到第一个匹配的元素后即停止查找 |
not exists | 使用not exists来优化查询 |
using filesort | 使用额外操作进行排序,通常会出现在order by或group by查询中 |
using index | 使用了覆盖索引进行查询 |
using temporary | mysql需要使用临时表来处理查询,常见于排序,子查询,和分组查询 |
using where | 需要在mysql服务器层使用where条件来过滤数据 |
select tables optimized away | 直接通过索引来获得数据,不用访问表,这种情况通常效率是最高的 |
7. possible_keys列
指出mysql能使用哪些索引来优化查询
查询列所涉及到的列上的索引都会被列出,但不一定会被使用
8. key列
查询优化器优化查询实际所使用的索引
如果表中没有可用的索引,则显示为null
如果查询使用了覆盖索引,则该索引仅出现在key列中
9. key_len列
显示mysql索引所使用的字节数,在联合索引中如果有3列,假如3列字段总长度为100个字节,key_len显示的可能会小于100字节,比如30字节,这就说明在查询过程中没有使用到联合索引的所有列,只是利用到了前面的一列或2列
- 表示索引字段的最大可能长度
- key_len的长度由字段定义计算而来,并非数据的实际长度
10. ref列
表示当前表在利用key列记录中的索引进行查询时所用到的列或常量
11. rows列
- 表示mysql通过索引的统计信息,估算出来的所需读取的行数(关联查询时,显示的是每次嵌套查询时所需要的行数)
- rows值的大小是个统计抽样结果,并不十分准确
12. filtered列
- 表示返回结果的行数占需读取行数的百分比
- filtered列的值越大越好(值越大,表明实际读取的行数与所需要返回的行数越接近)
- filtered列的值依赖统计信息,所以同样也不是十分准确,只是一个参考值
三. 执行计划的限制
- 无法展示存储过程,触发器,udf对查询的影响
- 无法使用explain对存储过程进行分析
- 早期版本的mysql只支持对select语句进行分析
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对的支持。
上一篇: Nginx服务器高性能优化的配置方法小结
推荐阅读