mysql 优化之COUNT(*)效率分析
刚给一个朋友解决他写的Discuz!插件的问题,说到MySQL的COUNT(*)的效率,发现越说越说不清楚,干脆写下来,分享给大家。
COUNT(*)与COUNT(COL)
网上搜索了下,发现各种说法都有:
比如认为COUNT(COL)比COUNT(*)快的;
认为COUNT(*)比COUNT(COL)快的;
还有朋友很搞笑的说到这个其实是看人品的。
在不加WHERE限制条件的情况下,COUNT(*)与COUNT(COL)基本可以认为是等价的;
但是在有WHERE限制条件的情况下,COUNT(*)会比COUNT(COL)快非常多;
具体的数据参考如下:
代码如下 | 复制代码 |
> SELECT COUNT(*) FROM cdb_posts where fid = 604; mysql> SELECT COUNT(tid) FROM cdb_posts where fid = 604; mysql> SELECT COUNT(pid) FROM cdb_posts where fid = 604; |
COUNT(*)通常是对主键进行索引扫描,而COUNT(COL)就不一定了,另外前者是统计表中的所有符合的纪录总数,而后者是计算表中所有符合的COL的纪录数。还有有区别的。
COUNT时的WHERE解决办法
顺便提下mysql的DISTINCT的关键字有很多你想不到的用处
1.在count 不重复的记录的时候能用到
比如
代码如下 | 复制代码 |
SELECT COUNT( DISTINCT id ) FROM tablename; |
就是计算talbebname表中id不同的记录有多少条
2,在需要返回记录不同的id的具体值的时候可以用
比如
代码如下 | 复制代码 |
SELECT DISTINCT id FROM tablename; |
返回talbebname表中不同的id的具体的值
3.上面的情况2对于需要返回mysql表中2列以上的结果时会有歧义
比如
代码如下 | 复制代码 |
SELECT DISTINCT id, type FROM tablename; |
实际上返回的是 id与type同时不相同的结果,也就是DISTINCT同时作用了两个字段,必须得id与tyoe都相同的才被排除了,与我们期望的结果不一样
简单说下,就是COUNT的时候,如果没有WHERE限制的话,MySQL直接返回保存有总的行数
而在有WHERE限制的情况下,总是需要对MySQL进行全表遍历。
优化总结,对于MyISAM表来说:
代码如下 | 复制代码 |
1.任何情况下SELECT COUNT(*) FROM tablename是最优选择; 2.尽量减少SELECT COUNT(*) FROM tablename WHERE COL = 'value' 这种查询; 3.杜绝SELECT COUNT(COL) FROM tablename WHERE COL2 = 'value' 的出现。 |