Mysql中分页查询的两个解决方法比较

程序员文章站 2023-11-21 15:04:52

mysql中分页查询有两种方式, 一种是使用count(*)的方式,具体代码如下复制代码代码如下:select count(*) from foo where b =...

mysql中分页查询有两种方式, 一种是使用count(*)的方式,具体代码如下

select count(*) from foo where b = 1; 
select a from foo where b = 1 limit 100,10; 

另外一种是使用sql_calc_found_rows

复制代码代码如下:

select sql_calc_found_rows a from foo where b = 1 limit 100, 10; 
select found_rows(); 

第二种方式调用sql_calc_found_rows之后会将where语句查询的行数放在found_rows()之中，第二次只需要查询found_rows()就可以查出有多少行了。

讨论这两种方法的优缺点：
首先原子性讲，第二种肯定比第一种好。第二种能保证查询语句的原子性，第一种当两个请求之间有额外的操作修改了表的时候，结果就自然是不准确的了。而第二种则不会。但是非常可惜，一般页面需要进行分页显示的时候，往往并不要求分页的结果非常准确。即分页返回的total总数大1或者小1都是无所谓的。所以其实原子性不是我们分页关注的重点。

下面看效率。这个非常重要，分页操作在每个网站上的使用都是非常大的，查询量自然也很大。由于无论哪种，分页操作必然会有两次sql查询，于是就有很多很多关于两种查询性能的比较：

sql_calc_found_rows真的很慢么？

http://hi.baidu.com/thinkinginlamp/item/b122fdaea5ba23f614329b14

to sql_calc_found_rows or not to sql_calc_found_rows?

http://www.mysqlperformanceblog.com/2007/08/28/to-sql_calc_found_rows-or-not-to-sql_calc_found_rows/

老王这篇文章里面有提到一个covering index的概念，简单来说就是怎样才能只让查询根据索引返回结果，而不进行表查询

具体看他的另外一篇文章：

mysql之covering index

http://hi.baidu.com/thinkinginlamp/item/1b9aaf09014acce0f45ba6d3

实验
结合这几篇文章，做的实验：

表：

复制代码代码如下:

create table if not exists `foo` ( 
`a` int(10) unsigned not null auto_increment, 
`b` int(10) unsigned not null, 
`c` varchar(100) not null, 
primary key (`a`), 
key `bar` (`b`,`a`) 
) engine=myisam; 

注意下这里是使用b,a做了一个索引，所以查询select * 的时候是不会用到covering index的，select a才会使用到covering index

复制代码代码如下:

<?php 

$host = '192.168.100.166'; 
$dbname = 'test'; 
$user = 'root'; 
$password = ''; 

$db = mysql_connect($host, $user, $password) or die('db connect failed'); 
mysql_select_db($dbname, $db); 

  
echo '==========================================' . "\r\n"; 

$start = microtime(true); 
for ($i =0; $i<1000; $i++) { 
    mysql_query("select sql_no_cache count(*) from foo where b = 1"); 
    mysql_query("select sql_no_cache a from foo where b = 1 limit 100,10"); 
} 
$end = microtime(true); 
echo $end - $start . "\r\n"; 

echo '==========================================' . "\r\n"; 

$start = microtime(true); 
for ($i =0; $i<1000; $i++) { 
    mysql_query("select sql_no_cache sql_calc_found_rows a from foo where b = 1 limit 100, 10"); 
    mysql_query("select found_rows()"); 
} 
$end = microtime(true); 
echo $end - $start . "\r\n"; 

echo '==========================================' . "\r\n"; 

$start = microtime(true); 
for ($i =0; $i<1000; $i++) { 
    mysql_query("select sql_no_cache count(*) from foo where b = 1"); 
    mysql_query("select sql_no_cache * from foo where b = 1 limit 100,10"); 
} 
$end = microtime(true); 
echo $end - $start . "\r\n"; 

echo '==========================================' . "\r\n"; 

$start = microtime(true); 
for ($i =0; $i<1000; $i++) { 
    mysql_query("select sql_no_cache sql_calc_found_rows * from foo where b = 1 limit 100, 10"); 
    mysql_query("select found_rows()"); 
} 
$end = microtime(true); 
echo $end - $start . "\r\n";

返回的结果：

和老王里面文章说的是一样的。第四次查询sql_calc_found_rows由于不仅是没有使用到covering index，也需要进行全表查询，而第三次查询count(*)，且select * 有使用到index，并没进行全表查询，所以有这么大的差别。

总结
ps：另外提醒下，这里是使用myisam会出现三和四的查询差别这么大，但是如果是使用innodb的话，就不会有这么大差别了。

所以我得出的结论是如果数据库是innodb的话，我还是倾向于使用sql_calc_found_rows

结论：sql_calc_found_rows和count(*)的性能在都使用covering index的情况下前者高，在没使用covering index情况下后者性能高。所以使用的时候要注意这个。

上一篇： js与自动伸缩图片自动缩小图片的多浏览器兼容的方法总结原创

下一篇： PHP容易忘记的知识点分享

Mysql中分页查询的两个解决方法比较