MySQL的join查询和索引

时间 2019-11-13

标签 mysql join 查询索引栏目 MySQL 繁體版

原文原文链接

1 关于join查询sql

下面是例子分析
表A记录以下：
aID aNum
1 a20050111
2 a20050112
3 a20050113
4 a20050114
5 a20050115数据库

表B记录以下:
bID bName
1 2006032401
2 2006032402
3 2006032403
4 2006032404
8 2006032408数据库设计

建立这两个表SQL语句以下：
CREATE TABLE a
aID int( 1 ) AUTO_INCREMENT PRIMARY KEY ,
aNum char( 20 )
)
CREATE TABLE b(
bID int( 1 ) NOT NULL AUTO_INCREMENT PRIMARY KEY ,
bName char( 20 )
)大数据

INSERT INTO a
VALUES ( 1, 'a20050111' ) , ( 2, 'a20050112' ) , ( 3, 'a20050113' ) , ( 4, 'a20050114' ) , ( 5, 'a20050115' ) ;优化

INSERT INTO b
VALUES ( 1, ' 2006032401' ) , ( 2, '2006032402' ) , ( 3, '2006032403' ) , ( 4, '2006032404' ) , ( 8, '2006032408' ) ;spa

实验以下:
1.left join(左联接)设计

sql语句以下:
SELECT * FROM a
LEFT JOIN b
ON a.aID =b.bID排序

结果以下:
aID aNum bID bName
1 a20050111 1 2006032401
2 a20050112 2 2006032402
3 a20050113 3 2006032403
4 a20050114 4 2006032404
5 a20050115 NULL NULL
（所影响的行数为 5 行）索引

结果说明:
left join是以A表的记录为基础的,A能够当作左表,B能够当作右表,left join是以左表为准的.
换句话说,左表(A)的记录将会所有表示出来,而右表(B)只会显示符合搜索条件的记录(例子中为: A.aID = B.bID).
B表记录不足的地方均为NULL.ci

2.right join(右联接)

sql语句以下:
SELECT * FROM a
RIGHT JOING b
ON a.aID = b.bID

结果以下:
aID aNum bID bName
1 a20050111 1 2006032401
2 a20050112 2 2006032402
3 a20050113 3 2006032403
4 a20050114 4 2006032404
NULL NULL 8 2006032408
（所影响的行数为 5 行）

结果说明:
仔细观察一下,就会发现,和left join的结果恰好相反,此次是以右表(B)为基础的,A表不足的地方用NULL填充.

3.inner join(相等联接或内联接)

sql语句以下:
SELECT * FROM a
INNER JOIN b
ON a.aID =b.bID

等同于如下SQL句:
SELECT *
FROM a,b
WHERE a.aID = b.bID

结果以下:
aID aNum bID bName
1 a20050111 1 2006032401
2 a20050112 2 2006032402
3 a20050113 3 2006032403
4 a20050114 4 2006032404

结果说明:
很明显,这里只显示出了 A.aID = B.bID的记录.这说明inner join并不以谁为基础,它只显示符合条件的记录.
LEFT JOIN操做用于在任何的 FROM 子句中，

组合来源表的记录。使用 LEFT JOIN 运算来建立一个左边外部联接。左边外部联接将包含了从第一个（左边）开始的两个表中的所有记录，即
使在第二个（右边）表中并无相符值的记录。

语法：FROM table1 LEFT JOIN table2 ON table1.field1 compopr table2.field2
说明：table1, table2参数用于指定要将记录组合的表的名称。
field1, field2参数指定被联接的字段的名称。且这些字段必须有相同的数据类型及包含相同类型的数据，但它们不须要有相同的
名称。
compopr参数指定关系比较运算符："="， "<"， ">"， "<="， ">=" 或 "<>"。
若是在INNER JOIN操做中要联接包含Memo 数据类型或 OLE Object 数据类型数据的字段，将会发生错误。

2 关于索引的使用

索引分单列索引和组合索引。单列索引，即一个索引只包含单个列，一个表能够有多个单列索引，但这不是组合索引。组合索引，即一个索包含多个列。

MySQL索引类型包括：

（1）普通索引

这是最基本的索引，它没有任何限制。它有如下几种建立方式：

◆建立索引

CREATE INDEX indexName ON mytable(username(length));
若是是CHAR，VARCHAR类型，length能够小于字段实际长度；若是是BLOB和TEXT类型，必须指定 length，下同。

◆修改表结构

ALTER mytable ADD INDEX [indexName] ON (username(length))
◆建立表的时候直接指定

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, INDEX [indexName] (username(length)) );

删除索引的语法：

DROP INDEX [indexName] ON mytable;

（2）惟一索引

它与前面的普通索引相似，不一样的就是：索引列的值必须惟一，但容许有空值。若是是组合索引，则列值的组合必须惟一。它有如下几种建立方式：

◆建立索引

CREATE UNIQUE INDEX indexName ON mytable(username(length))
◆修改表结构

ALTER mytable ADD UNIQUE [indexName] ON (username(length))
◆建立表的时候直接指定

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, UNIQUE [indexName] (username(length)) );

（3）主键索引

它是一种特殊的惟一索引，不容许有空值。通常是在建表的时候同时建立主键索引：

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, PRIMARY KEY(ID) );
固然也能够用 ALTER 命令。记住：一个表只能有一个主键。

（4）组合索引

为了形象地对比单列索引和组合索引，为表添加多个字段：

CREATE TABLE mytable(
ID INT NOT NULL, username VARCHAR(16) NOT NULL, city VARCHAR(50) NOT NULL, age INT NOT NULL );
为了进一步榨取MySQL的效率，就要考虑创建组合索引。就是将 name, city, age建到一个索引里：

ALTER TABLE mytable ADD INDEX name_city_age (name(10),city,age);
建表时，usernname长度为 16，这里用 10。这是由于通常状况下名字的长度不会超过10，这样会加速索引查询速度，还会减小索引文件的大小，提升INSERT的更新速度。

若是分别在 usernname，city，age上创建单列索引，让该表有3个单列索引，查询时和上述的组合索引效率也会大不同，远远低于咱们的组合索引。虽然此时有了三个索引，但MySQL只能用到其中的那个它认为彷佛是最有效率的单列索引。

创建这样的组合索引，实际上是至关于分别创建了下面三组组合索引：

usernname,city,age usernname,city usernname
为何没有 city，age这样的组合索引呢？这是由于MySQL组合索引“最左前缀”的结果。简单的理解就是只从最左面的开始组合。并非只要包含这三列的查询都会用到该组合索引，下面的几个SQL就会用到这个组合索引：

SELECT * FROM mytable WHREE username="admin" AND city="郑州" SELECT * FROM mytable WHREE username="admin"
而下面几个则不会用到：

SELECT * FROM mytable WHREE age=20 AND city="郑州" SELECT * FROM mytable WHREE city="郑州"

（5）创建索引的时机

到这里咱们已经学会了创建索引，那么咱们须要在什么状况下创建索引呢？通常来讲，在WHERE和JOIN中出现的列须要创建索引，但也不彻底如此，由于MySQL只对<，<=，=，>，>=，BETWEEN，IN，以及某些时候的LIKE才会使用索引。例如：

SELECT t.Name FROM mytable t LEFT JOIN mytable m ON t.Name=m.username WHERE m.age=20 AND m.city='郑州'
此时就须要对city和age创建索引，因为mytable表的userame也出如今了JOIN子句中，也有对它创建索引的必要。

刚才提到只有某些时候的LIKE才需创建索引。由于在以通配符%和_开头做查询时，MySQL不会使用索引。例以下句会使用索引：

SELECT * FROM mytable WHERE username like'admin%'
而下句就不会使用：

SELECT * FROM mytable WHEREt Name like'%admin'
所以，在使用LIKE时应注意以上的区别。

（6）索引的不足之处

上面都在说使用索引的好处，但过多的使用索引将会形成滥用。所以索引也会有它的缺点：

◆虽然索引大大提升了查询速度，同时却会下降更新表的速度，如对表进行INSERT、UPDATE和DELETE。由于更新表时，MySQL不只要保存数据，还要保存一下索引文件。

◆创建索引会占用磁盘空间的索引文件。通常状况这个问题不太严重，但若是你在一个大表上建立了多种组合索引，索引文件的会膨胀很快。

索引只是提升效率的一个因素，若是你的MySQL有大数据量的表，就须要花时间研究创建最优秀的索引，或优化查询语句。

（7）使用索引的注意事项

使用索引时，有如下一些技巧和注意事项：

◆索引不会包含有NULL值的列

只要列中包含有NULL值都将不会被包含在索引中，复合索引中只要有一列含有NULL值，那么这一列对于此复合索引就是无效的。因此咱们在数据库设计时不要让字段的默认值为NULL。

◆使用短索引

对串列进行索引，若是可能应该指定一个前缀长度。例如，若是有一个CHAR(255)的列，若是在前10个或20个字符内，多数值是唯一的，那么就不要对整个列进行索引。短索引不只能够提升查询速度并且能够节省磁盘空间和I/O操做。

◆索引列排序

MySQL查询只使用一个索引，所以若是where子句中已经使用了索引的话，那么order by中的列是不会使用索引的。所以数据库默认排序能够符合要求的状况下不要使用排序操做；尽可能不要包含多个列的排序，若是须要最好给这些列建立复合索引。

◆like语句操做

通常状况下不鼓励使用like操做，若是非使用不可，如何使用也是一个问题。like “%aaa%” 不会使用索引而like “aaa%”可使用索引。

◆不要在列上进行运算

select * from users where YEAR(adddate)<2007;
将在每一个行上进行运算，这将致使索引失效而进行全表扫描，所以咱们能够改为

select * from users where adddate<‘2007-01-01’; ◆不使用NOT IN和<>操做