数据库优化<二>SQL优化之SELECT优化 ――_MySQL
数据库的瓶颈经常出现在查询 语句中,当出现这样的问题时,我们一般的步骤是查看是否运用了正确的 索引,
这个可以通过explain sql statement来查看,找到对应的字段,合理的索引将会增加你呃数据的访问速度,但
任何事情都有一个度,如果索引太多,会在插入时要维护更多的索引,这也将是一个大的开销,但具体怎样才
合适呢,欢迎大神来讨论,这个我不再行,不过一般一个表中有主键活唯一键,再弄几个的话应该不是问题。
1.1、mysql是如何执行where字句的
这些语句通常很快:
SELECT COUNT(*) FROM tbl_name;SELECT MIN(key_part1),MAX(key_part1) FROM tbl_name;SELECT MAX(key_part2) FROM tbl_name WHERE key_part1=constant;SELECT ... FROM tbl_name ORDER BY key_part1,key_part2,... LIMIT 10;SELECT ... FROM tbl_name ORDER BY key_part1 DESC, key_part2 DESC, ... LIMIT 10;但前提是这些访问的字段部分都有索引,因为如min(),max(),order by 这些语句会用到排序的,但如果之前已经
建立好了索引,那么读的时候就通过二分的方法来 遍历Btree,这速度很快,如果没有索引,这个只能全表扫描,
速度会很慢的,对于第一个语句,在MyISAM和MEMORY存储引擎的表,可以直接读取这个值,因为这个有这
两个存储引擎有相应的计数器来维护数据,但innodb则必须全表扫描才能得到结果,截图如下:
mysql> explain select count(*) from b_order/G;*************************** 1. row *************************** id: 1 select_type: SIMPLE table: b_order type: indexpossible_keys: NULL key: status key_len: 1 ref: NULL rows: 274146 Extra: Using index1 row in set (0.01 sec)当使用该语句时,扫描了所有的行,但我们是用主键索引的,这个速度还比较快
1.2,mysql内部优化策略
1,count(*) 这个之前已经说了
2,mysql和oracle都是采用边读数据边判断数据,满足数据就发送到客户端,满足sql要求就结束查询,所以
谨记一下:如果对你的数据不是要求全部的行,比如只要满足当前sql的几行数据,最好加上limit语句,这
样会让数据库提前结束查询,少占内存,少读取数据,少网络带宽传输
3,HAVING语句如果在没有使用聚合函数如count(), min()等,没有group by语句时,将合并到where字句中
4,所有的常量表优先于其他表进行读取,一个常量表的定义为:
1,一个空表或者只有一行的表
2,如果一下表使用where字句时,用到了一个非空主键或唯一索引,并且这个搜索的是一个常量表达式
3,还有一种情况,就是join的一个表就只有几行,是否会优先读(可以试试)
如下面的语句:
SELECT * FROM t WHERE primary_key=1;SELECT * FROM t1,t2 WHERE t1.primary_key=1 AND t2.primary_key=t1.id;解释:1,第一个是一个小表,只有一行
2,这个先查他t1,因为其返回的数据只有一行
5,这里说一下join的策略:数据库没有那么智能,能一下就能找到好的join顺序来执行,他会把所有可能的
join顺序都试一下,调用存储引擎的api来评估代价,然后选择最小的代价进行执行,所以,我们写的表
的顺序,对优化器来说,是没有关系的
6,在同时使用group by 和order by时,如果字段都来自同一个表,将优先join该表
7,对于需要排序的数据,如果你在explain中查看到使用了文件排序,但你确定这个数据集不是很大的话,
可以在sql中指定SQL_SMALL_RESULT来使用内存临时表排序,这样会快些,方法为:
select sql_small_result * from table_name;8,MySQL有可能查询结果从索引中获得,但这个一般都是数值
9,HAVING语句是最后过滤结果的条件