MySQL容许在相同列上建立多个索引,不管是有意仍是无心,mysql须要单独维护重复的索引,而且优化器在优化查询的时候也须要逐个地进行考虑,这会影响性能。mysql
重复索引是指的在相同的列上按照相同的顺序建立的相同类型的索引,应该避免这样建立重复索引,发现之后也应该当即删除。但,在相同的列上建立不一样类型的索引来知足不一样的查询需求是能够的。sql
CREATE TABLE test(服务器
ID INT NOT NULL PRIMARY KEY,工具
A INT NOT NULL,性能
B INT NOT NULL,优化
UNIQUE(ID),索引
INDEX(ID),ci
) ENGINE=InnoDB;it
这段SQL建立了3个重复索引。一般并无理由这么作。test
冗余索引和重复索引有一些不一样,若是建立了索引(a,b),再建立索引(a)就是冗余索引,由于这只是前面一个索引的前缀索引,所以(a,b)也能够看成(a)来使用,可是(b,a)就不是冗余索引,索引(b)也不是,由于b不是索引(a,b)的最左前缀列,另外,其余不一样类型的索引在相同列上建立(如哈希索引和全文索引)不会是B-Tree索引的冗余索引,而不管覆盖的索引列是什么。
冗余索引一般发生再为表添加新索引的时候。例如,有人可能会增长一个新的索引(A,B)而不是扩展之后的索引(A)。还有一种状况是将一个索引扩展为(A,ID),其中ID是主键,对于InnoDB来讲主键已经包含在二级索引中了,因此这也是冗余的。
大多数状况下都不须要冗余索引,应该尽可能扩展已有的索引而不是建立新索引,但也有时候处于性能方面的考虑须要冗余索引,由于扩展已有的索引会致使其变得太大,从而影响其余使用该索引的查询性能。如:若是在整数列上有一个索引,如今须要额外增长一个很长的varchar列来扩展该索引,那么性可能会急剧降低,特别是有查询把这个索引看成覆盖索引,或者这是myisam表而且有不少范围查询的时候(因为myisam的前缀压缩)
好比,有一张userinfo表。这个表有1000000条数据,对每一个state_id值大概有20000条记录。在state_id有一个索引,那么下面的SQL咱们称之为Q1
SELECT count(*) FROM userinfo WHERE state_id=5; --Q1
改查询的执行速度大概是每秒115次(QPS)
还有一个SQL,咱们称之为Q2
SELECT state_id,city,address FROM userinfo WHERE state_id=5; --Q2
这个查询的QPS是10,提高该索引性能最简单的办法就是狂战索引为(state_id,city,address),让索引能覆盖查询:
ALERT TABLE userinfo ADD KEY state_id_2(state_id,city,address);
(注:state_id已经有索引了,根据前面的概念,这是一个冗余索引而不是重复索引)
怎么找出冗余索引和重复索引呢?
1.可使用Shlomi Noach的common_schema中的一些试图来定位,common_schema是一系列能够安装到服务器上的经常使用的存储和试图。
2.可使用Percona Toolkit中的pt_duplicate-key-checker,该工具经过分析表结构来找出冗余和重复的索引。
参考文献:
[1] Baron Schwartz等 著,宁海元等 译 ;《高性能MySQL》(第3版); 电子工业出版社 ,2013
高性能MySQL(第3版) 中文PDF带目录清晰版 下载