FULLTEXT 搜索
2018-01-19 本文已影响0人
TinyDolphin
FULLTEXT 搜索
MySQL 的全文搜索功能,不使用模板匹配操作的情况下,进行单词或短语的查找。
全文搜索 3 种类型:
- 自然语言搜索:将搜索字符串解析成一系列的单词,搜索出包含这些单词的行。
- 布尔模式搜索:搜索字符串中的单词包含修饰字符,用以表明某些特定的要求。
- 查询扩展搜索:第一阶段:自然语言搜索;第二阶段:将搜索字符串与第一阶段搜索的那些行连接起来,然后再进行一次搜索。
想要对表进行全文搜索,需要创建一个特殊类型的索引:
- 基于 FULLTEXT 索引
- 忽略掉一些常见词(常见:50%的行里出现过)
- 内建的常用单词(如:the after otfer)
- 少于 4 个字符的单词也会被忽略
- 全文搜索对单词的定义:由字母、数字、撇号和下划线构成的字符序列
- 可以为单个列或多个列创建 FULLTEXT 索引
自然语言 FULLTEXT 搜索
建表之后,使用运算符 match() 列出一个或多个用于搜索的列,并用 against() 指定搜索字符串
CREATE TABLE apothegm(
attribution VARCHAR(40) COMMENT '名人',
phrase TEXT COMMENT '名言'
)ENGINE = MyISAM;
-- 如果按 "名人"、"名言"、"名人+名言" 来搜索
ALTER TABLE apothegm
ADD FULLTEXT (phrase),
ADD FULLTEXT (attribution),
ADD FULLTEXT (phrase,attribution);
-- 把 phrase 所有包含单词"time" OR "soft" 的行找出来,默认全文搜索模式
SELECT * FROM apothegm WHERE match(phrase) against('time soft');
布尔模式的全文搜索
该模式,可以获得对多单词搜索的更多控制,使用 against('xxx' IN BOOLEAN MODE),有以下特点:
- 不会忽略掉常见词(50%)
- 查询结果不再排序
- 搜索可以要求短语里的所有单词按照特定顺序出现
- 也可以未创建 FULLTEXT 索引的列,进行布尔模式的全文搜索,只是慢一些。
-- 搜索包含 "bell book and candle" 这四个单词,且单词顺序一样的行
SELECT * FROM apothegm
WHERE match(attribution,phrase)
against('"bell book and candle"' IN BOOLEAN MODE);
-- 搜索包含 bell 但不包含 candle 的行
-- against('+bell -candle' IN BOOLEAN MODE);
-- 搜索单词以 soft 开头的行,如 soft* 与 soft、softly、softness 等相匹配
-- against('soft*' IN BOOLEAN MODE);
查询扩展全文搜索
使用 against('xxx' WITH QUERY EXPANSION);
SELECT * FROM apothegm
WHERE MATCH(attribution,phrase)
against('bell book' WITH QUERY EXPANSION);
配置全文搜索引擎
ft_min_word_len 和 ft_max_word_len 用于确定 FULLTEXT 索引里的那些单词所具有的最小长度(默认 4)和 最大长度(默认 84)。