关于MySQL索引的几点值得注意的事项
在数据库中,对性能影响最大的包括数据库的锁策略、缓存策略、索引策略、存储策略、执行计划优化策略。
索引策略决定数据库快速定位数据的效率,存储策略决定数据持久化的效率。
1.索引不存储null值。
更准确的说,单列索引不存储null值,复合索引不存储全为null的值。索引不能存储null,所以对这列采用is null条件时,因为索引上根本
没null值,不能利用到索引,只能全表扫描。
为什么索引列不能存null值?
将索引列值进行建树,其中必然涉及到诸多的比较操作。null值的特殊性就在于参与的运算大多取值为null。这样的话,null值实际上是不能
参与进建索引的过程。也就是说,null值不会像其他取值一样出现在索引树的叶子节点上。
2.不适合键值较少的列(重复数据较多的列)。
假如索引列type有5个键值,如果有1万条数据,那么 where type = 1将访问表中的2000个数据块。
再加*问索引块,一共要访问大于200个的数据块。
如果全表扫描,假设10条数据一个数据块,那么只需访问1000个数据块,既然全表扫描访问的数据块
少一些,肯定就不会利用索引了。
3.前导模糊查询不能利用索引(like '%xx'或者like '%xx%')
假如有这样一列code的值为'aaa','aab','baa','bab' ,如果where code like '%ab'条件,由于前面是
模糊的,所以不能利用索引的顺序,必须一个个去找,看是否满足条件。这样会导致全索引扫描或者全表扫
描。如果是这样的条件where code like 'a % ',就可以查找code中a开头的code的位置,当碰到b开头的
数据时,就可以停止查找了,因为后面的数据一定不满足要求。这样就可以利用索引了。
4.mysql主要提供2种方式的索引:b-tree索引,hash索引。
b树索引具有范围查找和前缀查找的能力,对于有n节点的b树,检索一条记录的复杂度为o(logn)。相当于二分查找。
哈希索引只能做等于查找,但是无论多大的hash表,查找复杂度都是o(1)。
显然,如果值的差异性大,并且以等值查找(=、 <、>、in)为主,hash索引是更高效的选择,它有o(1)的查找复杂度。
如果值的差异性相对较差,并且以范围查找为主,b树是更好的选择,它支持范围查找。
mysql中两大主要存储引擎myisam和innodb采用了不同的索引和存储策略,本文将分析它们的异同和性能。