MySQL优化之如何查找SQL效率低的原因
查询到效率低的 sql 语句 后,可以通过 explain 或者 desc 命令获取 mysql 如何执行 select 语句的信息,包括在 select 语句执行过程中表如何连接和连接的顺序,比如我们想计算 2006 年所有公司的销售额,需要关联 sales 表和 company 表,并且对 profit 字段做求和( sum )操作,相应 sql 的执行计划如下:
mysql> explain select sum(profit) from sales a,company b where a.company_id = b.id and a.year = 2006\g;
*************************** 1. row ***************************
id: 1
select_type: simple
table: a
type: all
possible_keys: null
key: null
key_len: null
ref: null
rows: 12
extra: using where
*************************** 2. row ***************************
id: 1
select_type: simple
table: b
type: all
possible_keys: null
key: null
key_len: null
ref: null
rows: 12
extra: using where
2 rows in set (0.00 sec)
每个列的解释如下:
•select_type :表示 select 的 类型,常见的取值有 simple (简单表,即不使用表连接或者子查询)、 primary (主查询,即外层的查询)、 union ( union 中的第二个或者后面的查询语句)、 subquery (子查询中的第一个 select )等。
•table :输出结果集的表。
•type :表示表的连接类型,性能由好到差的连接类型为 system (表中仅有一行,即常量表)、 const (单表中最多有一个匹配行,例如 primary key 或者 unique index )、 eq_ref (对于前面的每一行,在此表中只查询一条记录,简单来说,就是多表连接中使用 primary key 或者 unique index )、 ref (与 eq_ref 类似,区别在于不是使用 primary key 或者 unique index ,而是使用普通的索引)、 ref_or_null ( 与 ref 类似,区别在于条件中包含对 null 的查询 ) 、 index_merge ( 索引合并优化 ) 、 unique_subquery ( in 的后面是一个查询主键字段的子查询)、 index_subquery ( 与 unique_subquery 类似,区别在于 in 的后面是查询非唯一索引字段的子查询)、 range (单表中的范围查询)、 index (对于前面的每一行,都通过查询索引来得到数据)、 all (对于前面的每一行,都通过全表扫描来得到数据)。
•possible_keys :表示查询时,可能使用的索引。
•key :表示实际使用的索引。
•key_len :索引字段的长度。
•rows :扫描行的数量。
•extra :执行情况的说明和描述。
在上面的例子中,已经可以确认是 对 a 表的全表扫描导致效率的不理想,那么 对 a 表的 year 字段创建索引,具体如下:
mysql> create index idx_sales_year on sales(year);
query ok, 12 rows affected (0.01 sec)
records: 12 duplicates: 0 warnings: 0
创建索引后,这条语句的执行计划如下:
mysql> explain select sum(profit) from sales a,company b where a.company_id = b.id and a.year = 2006\g;
*************************** 1. row ***************************
id: 1
select_type: simple
table: a
type: ref
possible_keys: idx_sales_year
key: idx_sales_year
key_len: 4
ref: const
rows: 3
extra:
*************************** 2. row ***************************
id: 1
select_type: simple
table: b
type: all
possible_keys: null
key: null
key_len: null
ref: null
rows: 12
extra: using where
2 rows in set (0.00 sec)
可以发现建立索引后对 a 表需要扫描的行数明显减少(从全表扫描减少到 3 行),可见索引的使用可以大大提高数据库的访问速度,尤其在表很庞大的时候这种优势更为明显,使用索引优化 sql 是优化问题 sql 的一种常用基本方法,在后面的章节中我们会具体介绍如何使索引来优化 sql 。