MySQL分页优化
最近,帮同事重写了一个mysql sql语句,该sql语句涉及两张表,其中一张表是字典表(需返回一个字段),另一张表是业务表(本身就有150个字段,需全部返回),当然,字段的个数是否合理在这里不予评价。平时,返回的数据大概5w左右,系统尚能收到数据。但12月31日那天,数据量大概20w,导致sql执行时间过长,未能在规定的时间内反馈结果,于是系统直接报错。
一般的思路是用mysql的分页功能,即直接在原sql语句后面增加limit子句。但请注意,虽然你看到的反馈结果只是limit后面指定的数量,于是想当然的以为mysql只是检索了指定数量的数据,然后给予返回。其实,mysql内部实现的原理是,检索所有符合where条件的记录,然后返回指定数量的记录。从这个角度来看,直接在原sql语句后面添加limit子句只能说是一种可以实现功能的方案,但未必最优。
具体在本例中,首先我们来看一下150个字段的表的统计信息:
一行大概就占2k,而innodb默认页的大小为16k,这意味着,一个页中最多可存储8行的数据。随机读的可能性大大增加。而这无疑会对数据库系统的io造成极大的压力。
优化前
如果采用上述方案,即直接在原sql语句后面增加limit子句,下面,我们来看看它的执行情况。
首先,直接添加limit子句后的sql语句如下(已省略a1表的150个字段和a2中的一个字段):
其执行时间如下:
大概执行了32s,绝大部分都花费到sending data上了。sending data指的是服务器检索数据,读取数据,并将数据返回给客户端的时间。
关于上述执行结果,有以下几点需要说明:
1. 这是sql语句多次执行后的结果,这样就可以排除结果缓存的影响,事实上,每次查询的时长都是32s左右。
2. 为什么选用的是limit 50000,10000,而不是0,10000,这个主要是考虑到对于limit子句来说,越到后面,分页的成本越高。基于此,选择了中间值来作为分页的结果。
该语句的执行计划如下:
优化后:
优化的思路:
只对该表的主键进行分页,然后用返回的主键作为子查询的结果,来检索该表其它字段的值。
改写后的sql语句如下:
其执行时间如下:
大概3s多,比第一种方案快了差不多10倍,效果显著。
下面来看看其执行计划(explain extended)
总结:
1. 改写后的语句原本如下:
但mysql报以下错误:
需再增加一个嵌套子查询,
比如这样的语句是不能正确执行的。
但是,只要你再加一层就行。如:
这样就可以绕开limit子查询的问题。
问题解决。
2. 如果想查看mysql查询优化器等价改写后的sql语句,可首先通过explain extended得到具体的执行计划,然后通过show warnings查看。
具体在本例中,等价改写后的sql语句如下:
与设想中的执行顺序一致~
3. 如何查看mysql语句各步骤的执行时间。
以上就是本文的全部内容,希望对大家mysql分页优化有所帮助。