MySQL索引之哈希索引

程序员文章站 2023-12-28 11:43:52

...

下面着力讲解建立自己的MySQL哈希索引,想法非常简单，在标准的B-Tree索引上创建一个伪哈希索引。它和真正的哈希索引不是一回事，

哈希索引（Hash Index）建立在哈希表的基础上，它只对使用了索引中的每一列的精确查找有用。对于每一行，，存储引擎计算出了被索引的哈希码（Hash Code），它是一个较小的值，并且有可能和其他行的哈希码不同。它把哈希码保存在索引中，并且保存了一个指向哈希表中的每一行的指针。

在mysql中，只有memory存储引擎支持显式的哈希索引。如果多个值有相同的哈希码，索引就会把行指针以链表的方式保存在哈希表的同一条记录中。

哈希索引的细节还有很多，由于myISAM和innodb并不支持，所以在这里不详解。

下面着力讲解建立自己的MySQL哈希索引

想法非常简单，在标准的B-Tree索引上创建一个伪哈希索引。它和真正的哈希索引不是一回事，因为它还是使用B-Tree索引进行查找。然而，它将会使用键的哈希值进行查找，而不是键自身。你所要做的事情就是在where子句中手动地定义哈希函数。

例子：URL查找。

URL通常会导致B-Tree索引变大，因为它们非常长。通常会按照下面的方式来查找URL表。

mysql>select id from url where url='http://www.linuxidc.com';

但是，如果移除掉url列上的索引并且给表添加一个被索引的url_src列，就可以按照下面的方式进行查询：

mysql>select id from url where url='http://www.linuxidc.com' and url_src=CRC32('http://www.linuxidc.com');

mysql查询优化器注意到url_src列上有很小的，选择性很高的索引，并且它会使用里面的值进行索引查找。即使有几列相同的url_src值，也很容易进行精确的对比来确定需要的行。替代方案是把完整的URL索引为字符串，它要慢很多。

这个办法的一个缺点就是要维护哈希值。你可以手工进行维护，在mysql5.0 以上版本中，可以使用触发器来进行维护。

1.创建一个表：

接下来创建触发器。我们先暂时更新一下命令分隔符，这样就可以在触发器中使用分号：

剩下的工作就是验证触发器自动维护了哈希值。

如果使用这种方式，就不应该使用SHA1()和MD5()这此哈希函数。它们返回很长的字符串，会浪费大量的存储空间并且减慢比较速度。它们是强加密函数，被设计为不产生任务冲突。这并不是我们的目标。简单的哈希函数能在有较好性能的同时保证可接受的冲突率。当然，如果表有很多行并且CRC32()产生了很多冲突，就要实现自己的64位哈希函数，要确保自己的函数返回整数，而不是字符串。

mysql>select conv(right(md5('http://www.linuxidc.com/'),16),16,10) as hash64;

MySQL索引之哈希索引

相关标签： MySQL索引 MySQL索引之哈希索引数据库 Oracl

MySQL索引之哈希索引

mysql中order by 语句的用法索引优化

MySQL优化之延迟索引和分页优化

搜索引擎 - php+mysql中文站搜索目前用什么方案

加速PHP动态网站关于MySQL索引分析优化

MySQL字符串索引更合理的创建规则讨论

MySQL表设计优化与索引

mysql 普通索引唯一索引的创建与效率比较

高性能的MySQL（5）索引策略一压缩，冗余，重复，索引和锁

MySQL 8.0 新特性之哈希连接（Hash Join）

MySQL数据库索引使用方法

MySQL索引之哈希索引

mysql中order by 语句的用法 索引优化

MySQL优化之延迟索引和分页优化

搜索引擎 - php+mysql中文站搜索目前用什么方案

加速PHP动态网站 关于MySQL索引分析优化

MySQL字符串索引更合理的创建规则讨论

MySQL表设计优化与索引

mysql 普通索引 唯一索引的创建与效率比较

高性能的MySQL（5）索引策略一压缩，冗余，重复，索引和锁

MySQL 8.0 新特性之哈希连接（Hash Join）

MySQL数据库索引使用方法

mysql中order by 语句的用法索引优化

加速PHP动态网站关于MySQL索引分析优化

mysql 普通索引唯一索引的创建与效率比较