1. MySQL如何使用索引html
索引用于快速查找具备特定列值的行。若是没有索引,MySQL必须从第一行开始,而后遍历整个表以找到相关的行。表越大,花费越多。若是表中有相关列的索引,MySQL能够快速肯定要在数据文件中间查找的位置,而没必要查看全部数据。这比顺序读取每一行要快得多。mysql
大多数MySQL索引(PRIMARY KEY,UNIQUE,INDEX和FULLTEXT)存储在B树(B-tree)中。例外状况:空间数据类型的索引使用R树; MEMORY表还支持哈希索引。 InnoDB对FULLTEXT索引使用倒排列表。sql
MySQL使用索引进行如下操做:数据库
最后,索引对小表的查询不过重要。当查询须要访问大多数行时,顺序读取比处理索引快。缓存
2. 避免全表扫描服务器
当MySQL使用全表扫描来解析查询时,EXPLAIN的输出在type列中显示ALL。 这一般在如下状况下发生:数据结构
对于小表,表扫描一般是合适的,而且对性能的影响能够忽略不计。 性能
对于大表,能够尝试如下技术,以免优化器错误地选择表扫描:测试
3. 列索引优化
B树(B-tree)数据结构使索引能够在WHERE子句中快速找到与运算符(例如=,>,≤,BETWEEN,IN等)相对应的特定值,一组值或一系列值。
每一个存储引擎都会定义每一个表的最大索引数和最大索引长度。全部存储引擎支持每一个表至少16个索引,而且索引总长度至少为256个字节。
索引前缀
用col_name(N)能够建立仅使用列的前N个字符的索引。在InnoDB表中,前缀最长767字节。
全文索引
FULLTEXT索引用于全文搜索。仅InnoDB和MyISAM存储引擎支持FULLTEXT索引,而且仅支持CHAR,VARCHAR和TEXT列。索引始终在整个列上进行,而且不支持列前缀索引。
空间索引
指依据空间对象的位置和形状或空间对象之间的某种空间关系按必定的顺序排列的一种数据结构
MEMORY存储引擎上的索引
默认状况下,MEMORY存储引擎使用HASH索引,但也支持BTREE索引。
4. 多列索引
MySQL能够建立复合索引(即多列上的索引)。 一个索引最多能够包含16列。
假设有一张表示这样定义的:
CREATE TABLE test ( id INT NOT NULL, last_name CHAR(30) NOT NULL, first_name CHAR(30) NOT NULL, PRIMARY KEY (id), INDEX idx_name (last_name,first_name) );
idx_name索引是创建在last_name和first_name列之上的索引,该索引能够用于指定了last_name和first_name值组合的查询,也能够用于仅指定last_name值的查询,由于该索引是最左前缀匹配的。
所以,idx_name索引能够用于下列查询:
SELECT * FROM test WHERE last_name='Jones'; SELECT * FROM test WHERE last_name='Jones' AND first_name='John'; SELECT * FROM test WHERE last_name='Jones' AND (first_name='John' OR first_name='Jon'); SELECT * FROM test WHERE last_name='Jones' AND first_name >='M' AND first_name < 'N';
然而,idx_name索引不能用于下列查询:
SELECT * FROM test WHERE first_name='John'; SELECT * FROM test WHERE last_name='Jones' OR first_name='John';
考虑下面的SQL:
SELECT * FROM tbl_name WHERE col1=val1 AND col2=val2;
若是在col1和col2上存在一个多列索引,那么能够直接抓取适当的行。若是col1和col2上分别存在单独的单列索引,则优化器将尝试使用索引合并优化,或者经过肯定哪一个索引须要排除更多行来查找限制性最强的索引,并使用该索引来获取行。
若是表具备多列索引,那么优化器可使用该索引的任何最左前缀来查找行。例如,若是有一个三列索引(col1, col2, col3),那么在(col1), (col1, col2), (col1, col2, col3) 上具备索引搜索功能。
若是列不构成索引的最左前缀,则MySQL没法使用索引执行查找。
再看下面的SQL语句:
SELECT * FROM tbl_name WHERE col1=val1; SELECT * FROM tbl_name WHERE col1=val1 AND col2=val2; SELECT * FROM tbl_name WHERE col2=val2; SELECT * FROM tbl_name WHERE col2=val2 AND col3=val3;
若是在(col1, col2, col3)上存在复合索引,那么只有前两个查询会使用。然后最后两个查询不会使用索引来执行查找,由于(col2)和(col2,col3)并非(col1,col2,col3)的最左前缀。
5. B-Tree 和 Hash 索引的比较
B树索引特征
B树(B-tree)索引可用于使用=,>,>=,<,<=,BETWEEN运算符的表达式中的列比较。若是LIKE的参数是一个不以通配符开头的常量字符串,则该索引也能够用于LIKE比较。
下列这些子句不会使用索引:
/* the LIKE value begins with a wildcard character */ SELECT * FROM tbl_name WHERE key_col LIKE '%Patrick%'; /* the LIKE value is not a constant */ SELECT * FROM tbl_name WHERE key_col LIKE other_col;
没有覆盖WHERE子句中全部AND级别的任何索引都不会用于优化查询。换句话说,为了可以使用索引,必须在每一个AND组中使用索引的前缀。
下列WHERE子句会使用索引:
... WHERE index_part1=1 AND index_part2=2 AND other_column=3 /* index = 1 OR index = 2 */ ... WHERE index=1 OR A=10 AND index=2 /* optimized like "index_part1='hello'" */ ... WHERE index_part1='hello' AND index_part3=5 /* Can use index on index1 but not on index2 or index3 */ ... WHERE index1=1 AND index2=2 OR index1=3 AND index3=3;
下面这些WHERE子句不会使用索引:
/* index_part1 is not used */ ... WHERE index_part2=1 AND index_part3=2 /* Index is not used in both parts of the WHERE clause */ ... WHERE index=1 OR A=10 /* No index spans all rows */ ... WHERE index_part1=1 OR index_part2=10
有时,即便有可用的索引,MySQL也不使用索引。发生这种状况的一种可能缘由是,优化器估计使用索引将须要访问表中很大比例的行。(在这种状况下,表扫描可能会更快,由于它须要更少的查找。)可是,若是这样的查询使用LIMIT只检索某些行,则MySQL仍然使用索引,由于它能够更快地找到返回结果的几行。
哈希索引特征
哈希索引与刚刚讨论的索引具备一些不一样的特征:
B-tree
树型数据结构,普遍用于数据库索引中。该结构始终保持有序,从而能够快速查找精确匹配(等于运算符)和范围(例如,大于,小于和BETWEEN运算符)。 此类索引可用于大多数存储引擎,例如InnoDB和MyISAM。
由于B树节点能够有不少子节点,因此B树与二叉树不一样,后者的每一个节点最多只能有2个子节点。
术语B树的使用旨在参考索引设计的通常类别。因为经典B树设计中不存在复杂性,MySQL存储引擎使用的B树结构可能被视为变体。
Hash index
一种索引类型,专用于使用相等运算符而不是范围运算符的查询。 它可用于MEMORY表。 尽管出于历史缘由,哈希索引是MEMORY表的默认索引,可是该存储引擎还支持B树索引,对于通常用途的查询而言,B树索引一般是更好的选择。
6. 优化数据大小
设计表以使得它们在磁盘上占用最少的空间。 经过减小写入磁盘和从磁盘读取的数据量,这能够带来巨大的改进。 较小的表一般在查询执行期间处理其内容时须要较少的主内存。表数据的任何空间减小都会致使索引变小,从而能够更快地处理索引。
MySQL支持许多不一样的存储引擎(表类型)和行格式。对于每一个表,能够决定使用哪一种存储和索引方法。为应用程序选择适当的表格式能够大大提升性能。
Table Columns
Row Format
Indexes
Joins
Normalization
7. 优化数据类型
数值类型
字符和字符串类型
其它