欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

MySQL 的全文搜索功能:FULLTEXT搜索实例讲解

程序员文章站 2022-03-23 20:04:43
FULLTEXT 搜索 MySQL 的全文搜索功能,不使用模板匹配操作的情况下,进行单词或短语的查找。 全文搜索 3 种类型: 1. 自然语言搜索:将搜索字符串解析成一系列的...

FULLTEXT 搜索

MySQL 的全文搜索功能,不使用模板匹配操作的情况下,进行单词或短语的查找。

全文搜索 3 种类型:

1. 自然语言搜索:将搜索字符串解析成一系列的单词,搜索出包含这些单词的行。

2. 布尔模式搜索:搜索字符串中的单词包含修饰字符,用以表明某些特定的要求。

3. 查询扩展搜索:第一阶段:自然语言搜索;第二阶段:将搜索字符串与第一阶段搜索的那些行连接起来,然后再进行一次搜索。

想要对表进行全文搜索,需要创建一个特殊类型的索引

- 基于 FULLTEXT 索引

- 忽略掉一些常见词(常见:50%的行里出现过)

- 内建的常用单词(如:the after otfer)

- 少于 4 个字符的单词也会被忽略

- 全文搜索对单词的定义:由字母数字撇号下划线构成的字符序列

- 可以为单个列或多个列创建 FULLTEXT 索引

自然语言 FULLTEXT 搜索

建表之后,使用运算符 match() 列出一个或多个用于搜索的列,并用 against() 指定搜索字符串

CREATE TABLE apothegm(
  attribution VARCHAR(40) COMMENT '名人',
  phrase      TEXT        COMMENT '名言'
)ENGINE = MyISAM;

-- 如果按 "名人"、"名言"、"名人+名言" 来搜索
ALTER TABLE apothegm
ADD FULLTEXT (phrase),
ADD FULLTEXT (attribution),
ADD FULLTEXT (phrase,attribution);

-- 把 phrase 所有包含单词"time" OR "soft" 的行找出来,默认全文搜索模式
SELECT * FROM apothegm WHERE match(phrase) against('time soft');
布尔模式的全文搜索

该模式,可以获得对多单词搜索的更多控制,使用 against(‘xxx’ IN BOOLEAN MODE),有以下特点:

- 不会忽略掉常见词(50%)

- 查询结果不再排序

- 搜索可以要求短语里的所有单词按照特定顺序出现

- 也可以未创建 FULLTEXT 索引的列,进行布尔模式的全文搜索,只是慢一些。

-- 搜索包含 "bell book and candle" 这四个单词,且单词顺序一样的行
SELECT * FROM apothegm
WHERE match(attribution,phrase)
against('"bell book and candle"' IN BOOLEAN MODE);
-- 搜索包含 bell 但不包含 candle 的行
-- against('+bell -candle' IN BOOLEAN MODE);
-- 搜索单词以 soft 开头的行,如 soft* 与 soft、softly、softness 等相匹配
-- against('soft*' IN BOOLEAN MODE);
查询扩展全文搜索

使用 against(‘xxx’ WITH QUERY EXPANSION);

SELECT * FROM apothegm
WHERE MATCH(attribution,phrase)
against('bell book' WITH QUERY EXPANSION);
配置全文搜索引擎

ft_min_word_len 和 ft_max_word_len 用于确定 FULLTEXT 索引里的那些单词所具有的最小长度(默认 4)和 最大长度(默认 84)。