Mysql的全文检索

当检索数据库时,为了优化性能,咱们使用一种叫索引的数据结构。当执行一个查询时,索引可以快速定位所需数据。
在这篇文章中,我将分享使用全文检索处理小型项目的经验,该项目使用倒排索引概念优化了查询性能。

什么是全文检索?

全文检索是一种检查记录中的全部单词以匹配提供的搜索条件的搜索技术(常常被搜索引擎所使用)。sql

能不能使用'LIKE'?

让咱们设想一个场景,一个电商网站想提供一个搜索功能,让用户可以使用相同的搜索字段对商品名称,商品种类,商品描述进行搜索。这能够经过Mysql的'LIKE'查询对三个列(商品名称,商品种类,商品描述)进行关键字搜索。数据库

SELECT * FROM product_test WHERE name LIKE ‘%top%’ and category LIKE ‘%top%’ and description LIKE ‘%top%’;

上述查询语句会随着数据体量的增长而下降性能。使用'LIKE'语句,有些搜索字词能够被很好地索引而且(性能)表现更好,而其余字词却不能被很好地索引从而提供更好的性能结果。基本上,通配符在查询语句中的位置决定了性能的高低。数据结构

索引范围越小,查询越快

为何'LIKE'不合适?

'LIKE'表达式包含两个部分 a)访问谓词(在第一个通配符前的内容) b)筛选谓词(除去访问谓词的其余内容)
访问谓词应该更具选择性,以使索引范围更小,查询更快。在上述示例中,'like'表达式不包含访问谓词,以至扫描了全部的记录。
like查询的耗时函数

什么是倒排索引?

全文检索技术使用了倒排索引的概念。倒排索引将每一个单词映射到其在记录或一组记录中的位置。这种结构在全文检索中有普遍的应用。我但愿咱们全部人都可以熟悉这种数据结构,由于这种数据结构能够影射为现实中书本的索引,咱们能够经过书本的索引找到对应主题的页码。倒排索引会告诉你特定搜索词所在的记录。性能

添加索引

全文索引在MySQL中是一种名为 FULLTEXT 类型的索引。FULLTEXT 索引能够在建立表时建立,或者在建立表以后经过ALTER TABLE/CREATE INDEX,从VARCHAR、TEXT类型的列建立。优化

CREATE TABLE product_test (id INT PRIMARY KEY, name VARCHAR(200),category VARCHAR(200),description TEXT, FULLTEXT (name,category, description));

搜索

搜索由Match函数执行。Match函数将列名做为参数,搜索的字词做为参数传递给Against函数。网站

SELECT id, MATCH (name,category, description) AGAINST (‘Top’) FROM product_test;

全文查询耗时

排序

搜索结果默认按相关性的降序排序,相关性最高的记录将先出现,而后出现相关性低的结果。搜索引擎

再看性能

在30,000条记录的上运行'LIKE'查询语句,耗时0.062秒,全文检索查询耗时0.011秒。结果显示,使用索引的全文检索方式比'LIKE'语句更块。spa

相关文章
相关标签/搜索