MySQL慢查询优化之慢查询日志分析的实例教程
数据库响应慢问题最多的就是查询了。现在大部分数据库都提供了性能分析的帮助手段。例如oracle中会帮你直接找出慢的语句,并且提供优化方案。在mysql中就要自己开启慢日志记录加以分析(记录可以保存在表或者文件中,默认是保存在文件中,我们系统使用的就是默认方式)。
先看看mysql慢查询日志里面的记录长什么样的:
time id command argument # time: 141010 9:33:57 # user@host: root[root] @ localhost [] id: 1 # query_time: 0.000342 lock_time: 0.000142 rows_sent: 3 rows_examined: 3 use test; set timestamp=1412904837; select * from t;
这个日志应该很好理解了,第一个#记录时间戳,第二个#记录执行命令的用户和地址信息,第三个#记录执行查询的时间、锁的时间、返回行数、被扫描的行数。接着后面记录真正执行的sql语句。还可以通过以下命令看看cvs存储格式每个字段意义。
show create table mysql.slow_log;
接下来说说如何获取和分析慢日志吧。
查看mysql慢日志参数
进入启动好的mysql,执行以下命令
mysql> show variables like '%slow_query%';
+---------------------------+----------------------------------------+ | variable_name | value | +---------------------------+----------------------------------------+ | slow_query_log | off | | slow_query_log_file | /usr/local/mysql/data/cloudlu-slow.log | +---------------------------+----------------------------------------+
这里告诉我们慢日志的日志存放位置,慢日志是否有开启。
那么什么样的查询需要被日志呢?在mysql中, 没有index的查询 以及 超过指定时间同时超过指定扫描行数的查询 需要记录在慢日志查询里面。
那么它们的参数又是怎么查看的呢?
没有index的查询记录开关
mysql> show global variables like '%indexes%';
+----------------------------------------+-------+ | variable_name | value | +----------------------------------------+-------+ | log_queries_not_using_indexes | off | | log_throttle_queries_not_using_indexes | 0 | +----------------------------------------+-------+
第一个参数 表示是否开启记录没有index的查询,第二个
参数用来做日志记录的流量控制,一分钟可以记录多少条,默认0是表示不限制。
超过指定时长的查询开关
mysql> show global variables like '%long_query%';
+-----------------+-----------+ | variable_name | value | +-----------------+-----------+ | long_query_time | 10.000000 | +-----------------+-----------+ 1 row in set (0.00 sec)
就一个参数指定超过多少时长的查询需要被记录
超过指定行数的扫描查询开关
mysql> show variables like '%min_examined_row_limit%';
+------------------------+-------+ | variable_name | value | +------------------------+-------+ | min_examined_row_limit | 0 | +------------------------+-------+ 1 row in set (0.00 sec)
默认是0,代表不现在扫描行数
设置开启mysql慢日志参数
进入mysql,输入以下命令或者在mysql的启动配置文件里面修改或者给mysql添加启动参数,进入mysql后的修改如下:
set global long_query_time=0.1; set global log_queries_not_using_indexes=on; set global slow_query_log = on;
这里要斟酌的有2点,第一是超过什么时长的日志是有问题的,这个由系统需求来决定。第二是没有使用indexes的日志每分钟要记录多少条,要防止日志太多对性能产生影响。
在实际的日志分析中,通常慢日志的log数量不少,同时相同的查询被记录的条数也会很多,这里就需要如何从慢日志查询中找到最有问题,最需要优化的日志。在这方面,有很多分析工具,最基本的分析工具就是mysql自带的mysqldumpslow,mysqldumpslow(perl脚本)的输出示例:
[root@cloudlu bin]# ./mysqldumpslow -s t -t 1 /usr/local/mysql/data/cloudlu-slow.log
reading mysql slow query log from /usr/local/mysql/data/cloudlu-slow.log count: 1 time=0.00s (0s) lock=0.00s (0s) rows=3.0 (3), root[root]@localhost select * from t
一看就非常清楚,它的输出主要 统计不同慢sql的出现次数(count 1),执行最长时间(time 0.00s),累计总耗费时间(time 0s),等待锁的时间(lock 0.00s),等待锁的总时间(lock 0s),发送给客户端的行总数(rows 3.0),扫描的行总数(rows 3),用户(root)以及sql语句本身。它最常用的参数包括:
- -s 排序选项:c 查询次数 r 返回记录行数 t 查询时间
- -t n:显示top n条查询
对于一般的分析已经差不多了,不过对于百分比等等数据mysqldumpslow就不够完善了。所以世界上多了很多各种mysql慢日志分析工具,比较优秀的有mysqlsla(perl脚本)和pt-query-digest(perl脚本),可以提供count, sql的执行次数及占总的slow log数量的百分比,time, 执行时间, 包括总时间, 平均时间, 最小, 最大时间, 时间占到总慢sql时间的百分比,95% of time, 去除最快和最慢的sql, 覆盖率占95%的sql的执行时间,lock time, 等待锁的时间,95% of lock , 95%的慢sql等待锁时间,rows sent, 结果行统计数量, 包括平均, 最小, 最大数量,rows examined, 扫描的行数量,还可以生成表报,存储分析结果。这里就不一一介绍了。
通过这些慢日志分析软件定位到了慢查询语句就已经完成了sql优化的一大半。接下来通过在mysql中执行explain或者desc命令查看慢查询语句,可以看出为什么sql查询慢。
mysql> explain select * from test.t \g
*************************** 1. row *************************** id: 1 select_type: simple table: t type: all possible_keys: null key: null key_len: null ref: null rows: 2 extra: null 1 row in set (0.00 sec)
它的输出格式细节可以关注mysql explain format,在输出中最要注意的是:
1. type:all是效率最差,最要注意的
2. key:是否有使用key,key长度如何
3. extra:最好不要出现filesort以及temporary,最主要是要关注在orderby和groupby。
note: sql优化是个很复杂的过程,有可能出现拆东墙补西墙的情况:比如给数据库表加入了索引之后,确实查询快了,可是存储空间加多了,插入删除操作耗时也增加了,如果在一个写多读少的系统中,执行这种优化可能会起到反效果。所以优化完之后千万不能大意,要持续监控系统,防止出现引入新瓶颈的情况。