Mysql 索引-2

关于MySQL索引的好处,若是正确合理设计而且使用索引的MySQL是一辆兰博基尼的话,那么没有设计和使用索引的MySQL就是一我的力三轮车。对于没有索引的表,单表查询可能几十万数据就是瓶颈,而一般大型网站单日就可能会产生几十万甚至几百万的数据,没有索引查询会变的很是缓慢。仍是以WordPress来讲,其多个数据表都会对常常被查询的字段添加索引,好比wp_comments表中针对5个字段设计了BTREE索引。前端

一个简单的对比测试

以我去年测试的数据做为一个简单示例,20多条数据源随机生成200万条数据,平均每条数据源都重复大概10万次,表结构比较简单,仅包含一个自增ID,一个char类型,一个text类型和一个int类型,单表2G大小,使用MyIASM引擎。开始测试未添加任何索引。mysql

执行下面的SQL语句:sql

1 mysql> SELECT id,FROM_UNIXTIME(timeFROM article WHERE a.title='测试标题'

查询须要的时间很是恐怖的,若是加上联合查询和其余一些约束条件,数据库会疯狂的消耗内存,而且会影响前端程序的执行。这时给title字段添加一个BTREE索引:数据库

1 mysql> ALTER TABLE article ADD INDEX index_article_title ON title(200);

再次执行上述查询语句,其对比很是明显:数据库设计

MySQL索引的概念

索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分),它们包含着对数据表里全部记录的引用指针。更通俗的说,数据库索引比如是一本书前面的目录,能加快数据库的查询速度。上述SQL语句,在没有索引的状况下,数据库会遍历所有200条数据后选择符合条件的;而有了相应的索引以后,数据库会直接在索引中查找符合条件的选项。若是咱们把SQL语句换成“SELECT * FROM article WHERE id=2000000”,那么你是但愿数据库按照顺序读取完200万行数据之后给你结果仍是直接在索引中定位呢?上面的两个图片鲜明的用时对比已经给出了答案(注:通常数据库默认都会为主键生成索引)。oop

索引分为聚簇索引和非聚簇索引两种,聚簇索引是按照数据存放的物理位置为顺序的,而非聚簇索引就不同了;聚簇索引能提升多行检索的速度,而非聚簇索引对于单行的检索很快。性能

MySQL索引的优化

上面都在说使用索引的好处,但过多的使用索引将会形成滥用。所以索引也会有它的缺点:虽然索引大大提升了查询速度,同时却会下降更新表的速度,如对表进行INSERT、UPDATE和DELETE。由于更新表时,MySQL不只要保存数据,还要保存一下索引文件。创建索引会占用磁盘空间的索引文件。通常状况这个问题不太严重,但若是你在一个大表上建立了多种组合索引,索引文件的会膨胀很快。索引只是提升效率的一个因素,若是你的MySQL有大数据量的表,就须要花时间研究创建最优秀的索引,或优化查询语句。下面是一些总结以及收藏的MySQL索引的注意事项和优化方法。测试

1. 什么时候使用汇集索引或非汇集索引?大数据

动做描述 使用汇集索引 使用非汇集索引
列常常被分组排序 使用 使用
返回某范围内的数据 使用 不使用
一个或极少不一样值 不使用 不使用
小数目的不一样值 使用 不使用
大数目的不一样值 不使用 使用
频繁更新的列 不使用 使用
外键列 使用 使用
主键列 使用 使用
频繁修改索引列 不使用 使用

事实上,咱们能够经过前面汇集索引和非汇集索引的定义的例子来理解上表。如:返回某范围内的数据一项。好比您的某个表有一个时间列,刚好您把聚合索引创建在了该列,这时您查询2004年1月1日至2004年10月1日之间的所有数据时,这个速度就将是很快的,由于您的这本字典正文是按日期进行排序的,聚类索引只须要找到要检索的全部数据中的开头和结尾数据便可;而不像非汇集索引,必须先查到目录中查到每一项数据对应的页码,而后再根据页码查到具体内容。其实这个具体用法我还不是很理解,只能等待后期的项目开发中慢慢学学了。优化

2. 索引不会包含有NULL值的列

只要列中包含有NULL值都将不会被包含在索引中,复合索引中只要有一列含有NULL值,那么这一列对于此复合索引就是无效的。因此咱们在数据库设计时不要让字段的默认值为NULL。

3. 使用短索引

对串列进行索引,若是可能应该指定一个前缀长度。例如,若是有一个CHAR(255)的列,若是在前10个或20个字符内,多数值是唯一的,那么就不要对整个列进行索引。短索引不只能够提升查询速度并且能够节省磁盘空间和I/O操做。

4. 索引列排序

MySQL查询只使用一个索引,所以若是where子句中已经使用了索引的话,那么order by中的列是不会使用索引的。所以数据库默认排序能够符合要求的状况下不要使用排序操做;尽可能不要包含多个列的排序,若是须要最好给这些列建立复合索引。

5. like语句操做

通常状况下不鼓励使用like操做,若是非使用不可,如何使用也是一个问题。like “%aaa%” 不会使用索引而like “aaa%”可使用索引。

6. 不要在列上进行运算

例如:select * from users where YEAR(adddate)<2007,将在每一个行上进行运算,这将致使索引失效而进行全表扫描,所以咱们能够改为:select * from users where adddate<’2007-01-01′。关于这一点能够围观:一个单引号引起的MYSQL性能损失。

最后总结一下,MySQL只对一下操做符才使用索引:<,<=,=,>,>=,between,in,以及某些时候的like(不以通配符%或_开头的情形)。而理论上每张表里面最多可建立16个索引,不过除非是数据量真的不少,不然过多的使用索引也不是那么好玩的,好比我刚才针对text类型的字段建立索引的时候,系统差点就卡死了。

相关文章
相关标签/搜索