使用索引是数据库性能优化的必备技能之一。在MySQL数据库中,有四种索引:汇集索引(主键索引)、普通索引、惟一索引以及咱们这里将要介绍的全文索引(FULLTEXT INDEX)。html
全文索引(也称全文检索)是目前搜索引擎使用的一种关键技术。它可以利用「分词技术「等多种算法智能分析出文本文字中关键字词的频率及重要性,而后按照必定的算法规则智能地筛选出咱们想要的搜索结果。在这里,咱们就不追根究底其底层实现原理了,如今咱们来看看在MySQL中如何建立并使用全文索引。mysql
在MySQL中,建立全文索引相对比较简单。例如,咱们有一个文章表(article
),其中有主键ID(id
)、文章标题(title
)、文章内容(content
)三个字段。如今咱们但愿可以在title
和content
两个列上建立全文索引,article
表及全文索引的建立SQL语句以下:算法
上面就是在建立表的同时创建全文索引的SQL示例。此外,若是咱们想要给已经存在的表的指定字段建立全文索引,一样以article
表为例,咱们可使用以下SQL语句进行建立:sql
在MySQL中建立全文索引以后,如今就该了解如何使用了。众所周知,在数据库中进行模糊查询是使用LIKE
关键字进行查询,例如:数据库
SELECT * FROM article WHERE content LIKE '%查询字符串%'
那么,咱们使用全文索引也是这样用的吗?固然不是,咱们必须使用特有的语法才能使用全文索引进行查询。例如,咱们想要在article
表的title
和content
列中全文检索指定的查询字符串,能够以下编写SQL语句:性能优化
SELECT * FROM article WHERE MATCH(title, content) AGAINST('查询字符串')
强烈注意:MySQL自带的全文索引只能用于数据库引擎为MyISAM的数据表,若是是其余数据引擎,则全文索引不会生效。此外,MySQL自带的全文索引只能对英文进行全文检索,目前没法对中文进行全文检索。若是须要对包含中文在内的文本数据进行全文检索,咱们须要采用Sphinx(斯芬克斯)/Coreseek技术来处理中文。本站将会在后续文章中对Sphinx以及Coreseek进行介绍。性能
备注1:目前,使用MySQL自带的全文索引时,若是查询字符串的长度太短将没法获得指望的搜索结果。MySQL全文索引所能找到的词的默认最小长度为4个字符。另外,若是查询的字符串包含中止词,那么该中止词将会被忽略。优化
备注2:若是可能,请尽可能先建立表并插入全部数据后再建立全文索引,而不要在建立表时就直接建立全文索引,由于前者比后者的全文索引效率要高。搜索引擎
推荐:http://www.cnblogs.com/tommy-huang/p/4483684.htmlspa