【Mysql优化】聚簇索引与非聚簇索引概念

时间 2019-11-18

标签 Mysql优化索引概念栏目 MySQL 繁體版

原文原文链接

　　必须为主键字段建立一个索引，这个索引就是所谓的"主索引"。主索引与惟一索引的惟一区别是：前者在定义时使用的关键字是PRIMARY而不是UNIQUE。

首先明白两句话:

　　innodb的次索引指向对主键的引用 (聚簇索引)html

　　myisam的次索引和主索引都指向物理行 (非聚簇索引)mysql

　　聚簇索引是对磁盘上实际数据从新组织以按指定的一个或多个列的值排序的算法。特色是存储数据的顺序和索引顺序一致。通常状况下主键会默认建立聚簇索引，且一张表只容许存在一个聚簇索引（理由：数据一旦存储，顺序只能有一种）。算法

在《数据库原理》一书中是这么解释聚簇索引和非聚簇索引的区别的：
　　聚簇索引的叶子节点就是数据节点，而非聚簇索引的叶子节点仍然是索引节点，只不过有指向对应数据块的指针。sql

INNODB和MYISAM的主键索引与二级索引的对比：数据库

　　也就是InnoDB的主索引的节点与数据放在一块儿，次索引的节点存放的是主键的位置。spa

　　　　　　myisam的主索引和次索引都指向该数据在磁盘的位置。指针

InnoDB的的二级索引的叶子节点存放的是KEY字段加主键值。所以，经过二级索引查询首先查到是主键值，而后InnoDB再根据查到的主键值经过主键索引找到相应的数据块。
而MyISAM的二级索引叶子节点存放的仍是列值与行号的组合，叶子节点中保存的是数据的物理地址。因此能够看出MYISAM的主键索引和二级索引没有任何区别，主键索引仅仅只是一个叫作PRIMARY的惟1、非空的索引，且MYISAM引擎中能够不设主键

也能够用下面这幅图理解:code

首先是myisam的索引主次索引都指向物理行:htm

InnoDB的主索引叶子节点是主键和数据，次索引指向主键blog

innodb的主索引文件上直接存放该行数据,称为聚簇索引,次索引指向对主键的引用

myisam中, 主索引和次索引,都指向物理行(磁盘位置).

注意: innodb来讲,

　　1: 主键索引既存储索引值,又在叶子中存储行的数据

　　2: 若是没有主键, 则会Unique key作主键

　　3: 若是没有unique,则系统生成一个内部的rowid作主键.

　　4: 像innodb中,主键的索引结构中,既存储了主键值,又存储了行数据,这种结构称为”聚簇索引”

一、聚簇索引
a) 一个索引项直接对应实际数据记录的存储页，可谓“直达”
b) 主键缺省使用它
c) 索引项的排序和数据行的存储排序彻底一致，利用这一点，想修改数据的存储顺序，能够经过改变主键的方法（撤销原有主键，另找也能知足主键要求的一个字段或一组字段，重建主键）
d) 一个表只能有一个聚簇索引（理由：数据一旦存储，顺序只能有一种）

二、非聚簇索引
a) 不能“直达”，可能链式地访问多级页表后，才能定位到数据页
b) 一个表能够有多个非聚簇索引

-------------------------------------聚簇索引优点劣势；-----------------------------------

　　优点: 根据主键查询条目比较少时,不用回行(数据就在主键节点下)

　　劣势: 若是碰到不规则数据插入时,形成频繁的页分裂.

聚簇索引的页分裂过程

理解: 原来索引以下

　　此时插入一个8，须要将13,16,17移动以后插入8


对于myisam引擎：只须要存储数据以后移动索引节点，
对于innoDb的聚簇索引：插入数据以后须要移动13,16,17.可是由于这三个节点上面有数据，也就形成了额外的开销。至关于三个节点搬家的同时带着数据搬家。　　




也能够用下图理解:

总结:

　　1: innodb的buffer_page 很强大.

　　2: 聚簇索引的主键值,应尽可能是连续增加的值,而不是要是随机值,

　　　　　　(不要用随机字符串或UUID)

　　　　不然会形成大量的页分裂与页移动.

　　为了看出效果能够用Java向数据库中按顺序插入1000条数据与乱序插入一千条数据。看执行的时间便可看出效果。







以下图:Innodb_pages_written表明已经写入的页数，能够按顺序插入1000条数据与乱序插入一千条数据观察增加的变化量。

mysql> show status like '%page_%';
+----------------------------------+-------+
| Variable_name                    | Value |
+----------------------------------+-------+
| Innodb_buffer_pool_pages_data    | 256   |
| Innodb_buffer_pool_pages_dirty   | 0     |
| Innodb_buffer_pool_pages_flushed | 749   |
| Innodb_buffer_pool_pages_free    | 243   |
| Innodb_buffer_pool_pages_misc    | 13    |
| Innodb_buffer_pool_pages_total   | 512   |
| Innodb_dblwr_pages_written       | 628   |
| Innodb_page_size                 | 16384 |
| Innodb_pages_created             | 67    |
| Innodb_pages_read                | 736   |
| Innodb_pages_written             | 749   |
| Tc_log_max_pages_used            | 0     |
| Tc_log_page_size                 | 0     |
| Tc_log_page_waits                | 0     |
+----------------------------------+-------+
14 rows in set (0.00 sec)

　　聚簇索引与非聚簇索引的区别参考:http://www.cnblogs.com/qlqwjy/p/7770580.html