Mysql基础知识整理笔记(疑问整理)

此篇主要整理基础篇中的疑问
PS:文章整理的知识内容及资料均来自极客时间《SQL必知必会》专栏优化

一、在MySQL统计行数中,SELECT COUNT(*)SELECT COUNT(1)SELECT COUNT(具体字段)的查询效率具体如何?

在MySQL InnoDB存储引擎中,COUNT(*)COUNT(1)都是对全部结果进行COUNT。若是有WHERE子句,则是对数据表的数据行数进行统计。所以COUNT(*)COUNT(1)本质上并无区别,执行的复杂度都是O(N),也就是采用全表扫描,进行循环 + 计数的方式进行统计。code

在MySQL MyISAM 存储引擎,统计数据表的行数只须要O(1)的复杂度,这是由于每张 MyISAM 的数据表都有一个 meta 信息存储了row_count值,而一致性则由表级锁来保证。由于 InnoDB 支持事务,采用行级锁和 MVCC 机制,因此没法像 MyISAM 同样,只维护一个row_count变量,所以须要采用扫描全表,进行循环 + 计数的方式来完成统计。排序

另外在 InnoDB 引擎中,若是采用COUNT(*)COUNT(1)来统计数据行数,要尽可能采用二级索引。由于主键采用的索引是聚簇索引,聚簇索引包含的信息多,明显会大于二级索引(非聚簇索引)。对于COUNT(*)COUNT(1)来讲,它们不须要查找具体的行,只是统计行数,系统会自动采用占用空间更小的二级索引来进行统计。索引

总结:
一、列名为主键, count(列名)count(1)count(*)执行效率是同样的:由于 explain 中 type 类型都为 index
二、列名不为主键,并且列名没有建立索引可是其余字段建立了索引: count(1) = count(*) > count(列名);因
为expalin 中的 type 类型 count(1)  和 count(*) 类型都为 index  而 count(列名) 的 type 类型为 all
三、列名不为主键,可是列名建立索引: count(1) = count(*)= count(列名);由于 explain 中 type 类型都为 index
四、若是表多个列而且没有主键,则 count(1) = count(*) 
五、若是表只有一个字段,则 select count(*)和  select count(1) 和  select count(列名)执行效率同样。

二、在MySQL中,LIMIT 关键词是最后执行的,若是确认结果集就只有一条,为什么还需加上LIMIT 1进行优化?

若是你能够肯定结果集只有一条,那么加上LIMIT 1的时候,当找到一条结果的时候就不会继续扫描了,这样会加快查询速度。若是数据表已经对字段创建了惟一索引,那么能够经过索引进行查询,不会全表扫描的话,就不须要加上LIMIT 1了。事务

三、 在WHERE子句中加索引能够快速定位数据,那为何须要在ORDER BY字段中也加上索引?

在 MySQL 中,支持两种排序方式,分别是 FileSort 和 Index 排序。在 Index 排序中,索引能够保证数据的有序性,不须要再进行排序,效率更高。而 FileSort 排序则通常在内存中进行排序,占用 CPU 较多。若是待排结果较大,会产生临时文件 I/O 到磁盘进行排序的状况,效率较低。因此使用 ORDER BY 子句时,应该尽可能使用 Index 排序,避免使用 FileSort 排序。固然你可使用 explain 来查看执行计划,看下优化器是否采用索引进行排序。内存

四、 ORDER BY 是对分的组排序仍是对分组中的记录排序呢?

ORDER BY 就是对记录进行排序。若是你在 ORDER BY 前面用到了 GROUP BY,实际上这是一种分组的聚合方式,已经把一组的数据聚合成为了一条记录,再进行排序的时候,至关于对分的组进行了排序。效率

相关文章
相关标签/搜索