10 分钟 MySQL 索引从入门到精通

10分钟,只要10分钟,带你了解 MySQL 索引的精华所在,走一走看一看,看了不吃亏,看了不上当~ :-Dphp

 

一、索引是作什么的?

索引用于快速找出在某个列中有一特定值的行。不使用索引,MySQL必须从第1条记录开始而后读完整个表直到找出相关的行。mysql

表越大,花费的时间越多。若是表中查询的列有一个索引,MySQL能快速到达一个位置去搜寻到数据文件的中间,没有必要看全部数据。sql

大多数MySQL索引(PRIMARY KEY、UNIQUE、INDEX和FULLTEXT)在B树中存储。只是空间列类型的索引使用R-树,而且MEMORY表还支持hash索引。数据库

二、索引好复杂,我该怎么理解索引,有没一个更形象点的例子?

有,想象一下,你面前有本词典,数据就是书的正文内容,你的大脑就是那个cpu,而索引,则是书的目录并发

三、索引越多越好?

大多数状况下索引能大幅度提升查询效率,但:异步

  • 数据的变动(增删改)都须要维护索引,所以更多的索引意味着更多的维护成本分布式

  • 更多的索引意味着也需要更多的空间 (一本100页的书,却有50页目录?)函数

  • 太小的表,建索引可能会更慢哦 :)  (读个2页的宣传手册,你还先去找目录?)性能

四、索引的字段类型问题

  • text类型,也可建索引(需指定长度)mysql索引

  • myisam存储引擎索引键长度综合不能超过1000字节

  • 用来筛选的值尽可能保持和索引列一样的数据类型

五、like 不能用索引?

  • 尽可能减小like,但不是绝对不可用,”xxxx%” 是能够用到索引的,

    想象一下,你在看一本成语词典,目录是按成语拼音顺序创建,查询需求是,你想找以 “一”字开头的成语(”一%“),和你想找包含一字的成语(“%一%”)

  • 除了like,如下操做符也可用到索引:

    <,<=,=,>,>=,BETWEEN,IN

    <>,not in ,!=则不行

六、什么样的字段不适合建索引?

  • 通常来讲,列的值惟一性过小(如性别,类型什么的),不适合建索引(怎样叫过小?通常说来,同值的数据超过表的百分之15,那就不必建索引了)

  • 太长的列,能够选择只创建部分索引,(如:只取前十位作索引)

  • 更新很是频繁的数据不适宜建索引(怎样叫很是?意会)

七、一次查询能用多个索引吗?

不能。

好比:

我有一个A表,有b,c,d字段,其中在b,c上各自加了索引。(可使用SQL:SHOW INDEX from A 查看A表的索引)

select * from A WHERE b=x and c=x; --x表示要查询的值

经过这条SQL,咱们能够看到有两列:possible_keys和key

pk表示此条SQL语句可能用到的索引,k表示实际用到的索引。

你会发现,实际只用到了一个索引,至因而b仍是c,mysql会经过分析选择使用给出结果集小的索引(cardinality),如经过b索引查询的记录比较少, 则会使用b做为实际索引。

注:嵌套、关联查询 explain 下能够看作屡次查询,而每次独立的查询均可以有单独的索引被使用。

八、多列查询该如何建索引?

一次查询只能用到一个索引,因此 首先枪毙 a,b各建索引方案

a仍是b? 谁的区分度更高(同值的最少),建谁!

固然,联合索引也是个不错的方案,ab,仍是ba,则同上,区分度高者,在前

九、联合索引的问题?

where a = “xxx” 可使用 AB 联合索引

where b = “xxx” 则不可 (再想象一下,这是书的目录?)

因此,大多数状况下,有AB索引了,就能够不用再去建一个A索引了

十、哪些常见状况不能用索引?

  • like “%xxx”

  • not in , !=

  • 对列进行函数运算的状况(如 where md5(password) = “xxxx”)

  • WHERE index=1 OR A=10

  • 存了数值的字符串类型字段(如手机号),查询时记得不要丢掉值的引号,不然没法用到该字段相关索引,反之则不要紧

    也即

    select * from test where mobile = 13711112222;

    但是没法用到mobile字段的索引的哦(若是mobile是char 或 varchar类型的话)

    btw,千万不要尝试用int来存手机号(为何?本身想!要不本身试试)

十一、覆盖索引(Covering Indexes)拥有更高效率

索引包含了所需的所有值的话,就只select 他们,换言之,只select 须要用到的字段,如无必要,尽可能避免select *

十二、NULL 的问题

 

  • 要尽可能避免 NULL,尽量地把字段定义为 NOT NULL。即便应用程序无须保存 NULL(没有值),也有许多表包含了可空列(Nullable Column),这仅仅是由于它为默认选项。除非真的要保存 NULL,不然就把列定义为 NOT NULL。 

  • MySQL难以优化引用了可空列的查询,它会使索引、索引统计和值更加复杂。可空列须要更多的储存空间,还须要在MySQL内部进行特殊处理。当可空列被索引的时候,每条记录都须要一个额外的字节,还可能致使 MyISAM 中固定大小的索引(例如一个整数列上的索引)变成可变大小的索引。 

  • 即便要在表中储存「没有值」的字段,仍是有可能不使用 NULL 的。考虑使用 0、特殊值或空字符串来代替它。 

  • 把 NULL 列改成 NOT NULL 带来的性能提高很小,因此除非肯定它引入了问题,不然就不要把它看成优先的优化措施。然而,若是计划对列进行索引,就要尽可能避免把它设置为可空。 

1三、如何查看索引信息,如何分析是否正确用到索引?

show index from tablename;

explain select ……;

关于explain,改天能够找个时间专门写一篇入门帖,在此以前,能够尝试 google

1四、了解本身的系统,不要过早优化!

过早优化,一直是个很是讨厌而又时刻存在的问题,大多数时候就是由于不了解本身的系统,不知道本身系统真正的承载能力

好比:几千条数据的新闻表,天天几百几千次的正文搜索,大多数时候咱们能够放心的去like,而不要又去建一套全文搜索什么的,毕竟cpu仍是比人脑厉害太多。

1五、后记:

看到这儿,也许你花了不止10分钟,但建议多看几遍,有条件的话最好上机尝试加深理解,纸上得来终觉浅,绝知此事要躬行嘛~

还有这篇文章几乎覆盖了《高性能MYSQL》中索引一章的全部结论,建议和那本书参照起来一块儿看,也许那本书就不那么难读了~

Refer:

[1] mysql索引须要了解的几个注意

http://thephper.com/?p=142

[2] mysql 查询能够同时使用几条索引

http://dwz.cn/2cJuCH

[3] MySQL 索引详解

http://my.oschina.net/leejun2005/blog/134932?fromerr=DQVDBPHK

[4] 关于mysql 索引自动优化机制: 索引选择性(Cardinality:索引基数)

http://my.oschina.net/leejun2005/blog/75688

[5] 如何应对并发(1) - 关于数据索引

http://dwz.cn/2cJwCQ

[6] 如何应对并发(2) - 请求合并及异步处理

http://dwz.cn/2cJxgS

[7] 如何应对并发(4) - 分布式数据库及反范式设计

http://dwz.cn/2dkjJM

相关文章
相关标签/搜索