MySql 索引

时间 2019-12-05

标签 mysql 索引栏目 MySQL 繁體版

原文原文链接

一、概述

索引是存储引擎用于快速查找记录的一种数据结构，经过合理的使用数据库索引能够大大提升系统的访问性能，接下来主要介绍在MySql数据库中索引类型，以及如何建立出更加合理且高效的索引技巧。
注：这里主要针对的是InnoDB存储引擎的B+Tree索引数据结构
二、索引的优势
一、大大减轻了服务器须要扫描的数据量，从而提升了数据的检索速度
二、帮助服务器避免排序和临时表
三、能够将随机I/O变为顺序I/O
三、索引的建立
3.一、主键索引java

ALTER TABLE 'table_name' ADD PRIMARY KEY 'index_name' ('column');

3.二、惟一索引数据库

ALTER TABLE 'table_name' ADD UNIQUE 'index_name' ('column');

3.三、普通索引服务器

ALTER TABLE 'table_name' ADD INDEX 'index_name' ('column');

3.四、全文索引数据结构

ALTER TABLE 'table_name' ADD FULLTEXT 'index_name' ('column');

3.五、组合索引函数

ALTER TABLE 'table_name' ADD INDEX 'index_name' ('column1', 'column2', ...);

四、B+Tree的索引规则
建立一个测试的用户表性能

DROP TABLE IF EXISTS user_test;
CREATE TABLE user_test(
	id int AUTO_INCREMENT PRIMARY KEY,
	user_name varchar(30) NOT NULL,
	sex bit(1) NOT NULL DEFAULT b'1',
	city varchar(50) NOT NULL,
	age int NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

建立一个组合索引：测试

ALTER TABLE user_test ADD INDEX idx_user(user_name , city , age);

4.一、索引有效的查询
4.1.一、全值匹配
全值匹配指的是和索引中的全部列进行匹配，如：以上面建立的索引为例，在where条件后可同时查询（user_name，city，age）为条件的数据。优化

SELECT * FROM user_test WHERE user_name = 'feinik' AND age = 26 AND city = '天津';

4.1.二、匹配最左前缀
匹配最左前缀是指优先匹配最左索引列，如：上面建立的索引可用于查询条件为：ui

（user_name ）、（user_name, city）、（user_name , city , age）

注：知足最左前缀查询条件的顺序与索引列的顺序无关，如：spa

（city, user_name）、（age, city, user_name）

4.1.三、匹配列前缀
指匹配列值的开头部分，如：查询用户名以feinik开头的全部用户

SELECT * FROM user_test WHERE user_name LIKE 'feinik%';

4.1.四、匹配范围值
如：查询用户名以feinik开头的全部用户，这里使用了索引的第一列

SELECT * FROM user_test WHERE user_name LIKE 'feinik%';

4.二、索引的限制
一、where查询条件中不包含索引列中的最左索引列，则没法使用到索引查询，如：

SELECT * FROM user_test WHERE city = '天津';

或

SELECT * FROM user_test WHERE age= 26;

或

SELECT * FROM user_test WHERE city = '天津' AND age = '26';

二、即便where的查询条件是最左索引列，也没法使用索引查询用户名以feinik结尾的用户

SELECT * FROM user_test WHERE user_name like '%feinik';

三、若是where查询条件中有某个列的范围查询，则其右边的全部列都没法使用索引优化查询，如：

SELECT * FROM user_test WHERE user_name = 'feinik' AND city LIKE '广州%' AND age = 26;

五、高效的索引策略
5.一、索引列不能是表达式的一部分，也不能做为函数的参数，不然没法使用索引查询。

SELECT * FROM user_test WHERE user_name = concat(user_name, 'fei');

5.二、前缀索引
有时候须要索引很长的字符列，这会增长索引的存储空间以及下降索引的效率，一种策略是可使用哈希索引，还有一种就是可使用前缀索引，前缀索引是选择字符列的前n个字符做为索引，这样能够大大节约索引空间，从而提升索引效率。
5.2.一、前缀索引的选择性
前缀索引要选择足够长的前缀以保证高的选择性，同时又不能太长，咱们能够经过如下方式来计算出合适的前缀索引的选择长度值：

（1）

SELECT COUNT(DISTINCT index_column)/COUNT(*) FROM table_name; -- index_column

表明要添加前缀索引的列

（2）

SELECT

COUNT(DISTINCT LEFT(index_column,1))/COUNT(*),

COUNT(DISTINCT LEFT(index_column,2))/COUNT(*),

COUNT(DISTINCT LEFT(index_column,3))/COUNT(*)

...

FROM table_name;

注：经过以上语句逐步找到最接近于（1）中的前缀索引的选择性比值，那么就可使用对应的字符截取长度来作前缀索引了
5.2.二、前缀索引的建立

5.2.三、使用前缀索引的注意点
前缀索引是一种能使索引更小，更快的有效办法，可是MySql没法使用前缀索引作ORDER BY 和 GROUP BY以及使用前缀索引作覆盖扫描。
5.三、选择合适的索引列顺序
在组合索引的建立中索引列的顺序很是重要，正确的索引顺序依赖于使用该索引的查询方式，对于组合索引的索引顺序能够经过经验法则来帮助咱们完成：将选择性最高的列放到索引最前列，该法则与前缀索引的选择性方法一致，但并非说全部的组合索引的顺序都使用该法则就能肯定，还须要根据具体的查询场景来肯定具体的索引顺序。
5.4 汇集索引与非汇集索引
一、汇集索引
汇集索引决定数据在物理磁盘上的物理排序，一个表只能有一个汇集索引，若是定义了主键，那么InnoDB会经过主键来汇集数据，若是没有定义主键，InnoDB会选择一个惟一的非空索引代替，若是没有惟一的非空索引，InnoDB会隐式定义一个主键来做为汇集索引。
汇集索引能够很大程度的提升访问速度，由于汇集索引将索引和行数据保存在了同一个B-Tree中，因此找到了索引也就相应的找到了对应的行数据，但在使用汇集索引的时候需注意避免随机的汇集索引（通常指主键值不连续，且分布范围不均匀），如使用UUID来做为汇集索引性能会不好，由于UUID值的不连续会致使增长不少的索引碎片和随机I/O，最终致使查询的性能急剧降低。
二、非汇集索引
与汇集索引不一样的是非汇集索引并不决定数据在磁盘上的物理排序，且在B-Tree中包含索引但不包含行数据，行数据只是经过保存在B-Tree中的索引对应的指针来指向行数据，如：上面在（user_name，city, age）上创建的索引就是非汇集索引。
5.五、覆盖索引
若是一个索引（如：组合索引）中包含全部要查询的字段的值，那么就称之为覆盖索引，如：

由于要查询的字段（user_name, city, age）都包含在组合索引的索引列中，因此就使用了覆盖索引查询，查看是否使用了覆盖索引能够经过执行计划中的Extra中的值为Using index则证实使用了覆盖索引，覆盖索引能够极大的提升访问性能。
5.六、如何使用索引来排序

在排序操做中若是能使用到索引来排序，那么能够极大的提升排序的速度，要使用索引来排序须要知足如下两点便可。

一、ORDER BY子句后的列顺序要与组合索引的列顺序一致，且全部排序列的排序方向（正序/倒序）需一致
二、所查询的字段值须要包含在索引列中，及知足覆盖索引
经过例子来具体分析
在user_test表上建立一个组合索引

ALTER TABLE user_test ADD INDEX index_user(user_name , city , age);

可使用到索引排序的案例

一、SELECT user_name, city, age FROM user_test ORDER BY user_name;

二、SELECT user_name, city, age FROM user_test ORDER BY user_name, city;

三、SELECT user_name, city, age FROM user_test ORDER BY user_name DESC, city DESC;

四、SELECT user_name, city, age FROM user_test WHERE user_name = 'feinik' ORDER BY city;

注：第4点比较特殊一点，若是where查询条件为索引列的第一列，且为常量条件，那么也可使用到索引
没法使用索引排序的案例
一、sex不在索引列中

SELECT user_name, city, age FROM user_test ORDER BY user_name, sex;

二、排序列的方向不一致

SELECT user_name, city, age FROM user_test ORDER BY user_name ASC, city DESC;

三、所要查询的字段列sex没有包含在索引列中

SELECT user_name, city, age, sex FROM user_test ORDER BY user_name;

四、where查询条件后的user_name为范围查询，因此没法使用到索引的其余列

SELECT user_name, city, age FROM user_test WHERE user_name LIKE 'feinik%' ORDER BY city;

五、多表链接查询时，只有当ORDER BY后的排序字段都是第一个表中的索引列（须要知足以上索引排序的两个规则）时，方可以使用索引排序。如：再建立一个用户的扩展表user_test_ext，并创建uid的索引。

DROP TABLE IF EXISTS user_test_ext;

CREATE TABLE user_test_ext(

    id int AUTO_INCREMENT PRIMARY KEY,

    uid int NOT NULL,

    u_password VARCHAR(64) NOT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

ALTER TABLE user_test_ext ADD INDEX index_user_ext(uid);

走索引排序

SELECT user_name, city, age FROM user_test u LEFT JOIN user_test_ext ue ON u.id = ue.uid ORDER BY u.user_name;

不走索引排序

SELECT user_name, city, age FROM user_test u LEFT JOIN user_test_ext ue ON u.id = ue.uid ORDER BY ue.uid;