mysql 索引整理

时间 2019-11-12

标签 mysql 索引整理栏目 MySQL 繁體版

原文原文链接

1：只对 where 和 order by 子句中须要的列添加索引，多余的索引智慧致使没必要要的硬盘空间爱你消耗。mysql

每次修改表信息时会更新索引，所以有索引的表性能会相应下降。程序员

2：对于要使用索引的列要使用属性 NOT NULL ，这样就永远不会存储 null 值。sql

3：最好用惟一化索引，通常状况下，当查询优化程序发现某个数据在超过30%的行里都有出现时，一般会不使用索引而进行全盘扫描。性能

4：索引长度尽可能短。若是要对一个字符型添加索引，好比给 char(50) 字段添加索引，若是它的前10个字节不一样然后面的基本相同，那么能够支队这前10个字节建立索引mysql索引

这样能减小索引多占的空间，又能够加快检索速度。测试

5：要充分利用最左侧前缀，这是针对复合索引而言的，例如对某表中的 c1 , c2 , c3 三个列建立了一个复合索引，索引项的顺序为 c1 , c2 , c3优化

可在查询时支队 c2 , c3 做为条件，那么基本上是用不到所建立的复合索引，由于他们都没有作左侧的 c1 字段，在对一下条件进行检索时会使用该索引网站

c1 , c2 , c3code

c1 , c2排序

编辑结束；

从接触PHP以来一直没作过真正的大型项目，顶多就作一些网店啊 ~ 我的博客呀 ~ 中介网啊这种小型网站。

最近在作一个音乐网，体积不大，可是我手里的数据量不大不小 ~

前几天为了一个查询两表互联例如表 a 和表 b 进行 a right join b 的时候没什么异常。

可是因为查询结果不是很理想应当用 a left join b 才是对的。结果这一个联表给我联了好几分钟都没有回应。

分析后发现，2个表相联的条件是 a 表的主键和 b 表的一个存储 a 表id列即 a left join b on a.id = b.aid

而b.aid 没有索引。当我给 b.aid 加上索引在查询结果发现恢复了原来的速度。查询没有任何异常。

对索引一直是只是了解而并不是真正的体验过。由于当我学会索引的时候我没有特地的用循环给2个表加10万条数据进行联表的测试。

此次的经验我知道原来索引是这么的重要。

今天我想完全对mysql索引进行了解。结果在网上搜集了一些资料一下的我对索引的解说

mysql 索引

普通索引 index

惟一索引 uniqe

全文索引 fulltext

其中主键也是惟一索引。这个应该谁都知道。

首先建立两个表分别是 a1 和 a2 每一个表中只有一个字段 id 没有设置索引每一个表有5000条记录

（其实最初我拿10000万条数据测试结果等的不耐烦了，改了5000条也等了一小会呢呵呵）

开始联表

select * from a1 left join a2 on a1.id = a2.id

耗费时间如图

如今给两个列增长索引在试一试

alter table a1 add index(id);
alter table a2 add index(id);

结果很明显，快了多少我就不说了。想象一下，若是你的数据量达到几万甚至几十万的状况下

在你是初级程序员的阶段还不了解 mysql索引的状况下明明sql语句没有问题一查就是漫长的进度条会不会很郁闷啊。。呵呵

就算有索引和无索引有如此大的差距，但也别有每一个列都要加索引的念头。由于索引坏处被他的好处给掩盖了。

索引列的信息是保存在索引文件中，数据表中的数据是保存在数据文件中。

据我了解联表带索引的表时速度快的缘由是由于带有索引的列在索引文件中会被排序。

例如数字1 - 5000 而没有索引的列在数据表中是没有排序的。

所以我在联两个表时 a1.id left a2.id 的时候 a2中的id 和 a1中的id 互相匹配的过程当中他们会来回 5000 X 5000 次

因为没有索引列没有排序过，在实际联表时由于是 left join 因此首先 a2.id 要和 a1.id 的 1号相匹配

那么在第一次匹配的时候 a2.id 的 1号和 a1.id 的1号匹配了。但此时匹配并不是中止 a2表中的还会继续往下找

检查 1号下面的 id 是否仍是 1 以此类推他在和 a1.id 中的 1号相联的时候他匹配了 5000次

当与 a1.id 的 2号匹配的时候仍是同样会去匹配 5000次。

而对有索引的列来讲由于索引列的数据排序过，会忽略没必要要的匹配所谓排序（据我了解）当我给 a2.id 加索引的那一刻

索引文件中的 a2.id 这个列会把全部数据从大到小排序即 1 - 5000

那么在联表时当 a2.id 的 1号跟 a1.id 1号相匹配以后明确知道接下来在a2.id 中在没有 1号了直接会跟

a1.id 的2号开始匹配一次类推结果他只匹配5000次。

也就是说在没有索引的状况下上面的联表会进行 2500万次的匹配，而设置索引以后仅匹配 5000次。

因为上述测试是使用 left join ，事实上只须要给 a2 的 id 加索引就能够了。给 a1.id 加索引是多余了。

谁适合加索引？简单来讲的话 where 条件中的列或 left join on 列 = 列时看联表方向此时是第二个列适合加索引。

那么谁又不适合加索引呢？列的数据重复率较高的列和修改率较高的列。

缘由是，重复列较高的列，例如性别，他只有男和女这2个数据若是设置了索引，那么只会增长无用的磁盘空间。

把男女排序了也就是男和女这2个数据，设置索引没有任何意义。

修改率高的列，上面说过，索引是会排序的，那么若是把修改率高的列设了索引那么每一次修改操做结束以后

索引文件也会从新排列全部数据，这样以来虽然在查询时能提升性能上的问题，可是在修，增的时候并不是如此。

多列索引

若是目前有一个用户表，分别有姓名，年龄，电话等列（假设这些列是最常被查询的）

有一个用户管理页中有一个搜索部分会根据输入的姓名，年龄，电话来搜索此人的详细记录。

那么这个时候到底给那一个列加索引比较好呀？（由于mysql一次只能使用一个索引，据我了解）

此时可使用多列索引

alter table user add index user_age_phone(user , age , phone)

建立多列索引以后如查询

where user='abc' and age = 25 and phone = 1234

mysql 直接会匹配 user = 'abc' 这一项在去匹配 age = 25 这一项接着去匹配 phone 这同样，三个条件仅仅3次匹配就获得结果了。

那么若是不使用多列索引的话咱们也只能给其中的一项列建立索引，假设咱们给 user 列建立了索引，那么当执行上述查询以后

由于 user 被设有索引所以找到 abc 只须要一次匹配以后的操做他首先会排除年龄不是 25岁的记录在去排除电话不是 1234 的记录。

这么以来虽然比没有任何索引的状况好了不少可是最终查询结果并不是是理想。

至于什么列须要家索引，什么列不须要加索引只能在实际状况中分析了。

【索引的使用】

在一下几种状况下 mysql 在查询中即便有索引也不会去使用

1：在多列索引，查询条件中用的不是最坐标的列，那么此时是不会使用索引。

2：like查询时 % 出如今第一位也不会使用索引

3：条件中有 or 也不会使用索引。

4：索引列类型是字符串，可在查询中省略了引号（有时字符串类型列也会存储数字），此时不会使用索引

5：若是 mysql 估计使用全表扫描比使用索引快，他也不会使用索引。

【如何检测所建立的索引是否有效（或者说索引使用状况）】

show status like 'Handler_read%'

Handler_read_key 越高越好

Handler_read_rnd_next 越高越很差