MySQL数据库优化分析

时间 2019-12-01

标签 mysql 数据库优化分析栏目 MySQL 繁體版

原文原文链接

前言

数据库优化一方面是找出系统的瓶颈,提升MySQL数据库的总体性能,而另外一方面须要合理的结构设计和参数调整,以提升用户的相应速度,同时还要尽量的节约系统资源,以便让系统提供更大的负荷.数据库

1. 优化一览图

优化分为了两大类,软优化和硬优化,软优化通常是操做数据库便可,而硬优化则是操做服务器硬件及参数设置.
缓存

2. 软优化

2.1 查询语句优化

1.首先咱们能够用EXPLAIN或DESCRIBE(简写:DESC)命令分析一条查询语句的执行信息.
2.例:bash

DESC SELECT * FROM `user`复制代码

显示:
服务器

其中会显示索引和查询数据读取数据条数等信息.架构

2.2 优化子查询

在MySQL中,尽可能使用JOIN来代替子查询.由于子查询须要嵌套查询,嵌套查询时会创建一张临时表,临时表的创建和删除都会有较大的系统开销,而链接查询不会建立临时表,所以效率比嵌套子查询高.并发

2.3 使用索引

索引是提升数据库查询速度最重要的方法之一,关于索引能够参高笔者<MySQL数据库索引>一文,介绍比较详细,此处记录使用索引的三大注意事项:高并发

LIKE关键字匹配'%'开头的字符串,不会使用索引.
OR关键字的两个字段必须都是用了索引,该查询才会使用索引.
使用多列索引必须知足最左匹配.

2.4 分解表

对于字段较多的表,若是某些字段使用频率较低,此时应当,将其分离出来从而造成新的表,性能

2.5 中间表

对于将大量链接查询的表能够建立中间表,从而减小在查询时形成的链接耗时.优化

2.6 增长冗余字段

相似于建立中间表,增长冗余也是为了减小链接查询.spa

2.7 分析表,,检查表,优化表

分析表主要是分析表中关键字的分布,检查表主要是检查表中是否存在错误,优化表主要是消除删除或更新形成的表空间浪费.

1. 分析表: 使用 ANALYZE 关键字,如ANALYZE TABLE user;

Op:表示执行的操做.
Msg_type:信息类型,有status,info,note,warning,error.
Msg_text:显示信息.

2. 检查表: 使用 CHECK关键字,如CHECK TABLE user [option]

option 只对MyISAM有效,共五个参数值:

QUICK:不扫描行,不检查错误的链接.
FAST:只检查没有正确关闭的表.
CHANGED:只检查上次检查后被更改的表和没被正确关闭的表.
MEDIUM:扫描行,以验证被删除的链接是有效的,也能够计算各行关键字校验和.
EXTENDED:最全面的的检查,对每行关键字全面查找.

3. 优化表:使用OPTIMIZE关键字,如OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE user;

LOCAL|NO_WRITE_TO_BINLOG都是表示不写入日志.,优化表只对VARCHAR,BLOB和TEXT有效,经过OPTIMIZE TABLE语句能够消除文件碎片,在执行过程当中会加上只读锁.

3. 硬优化

3.1 硬件三件套

1.配置多核心和频率高的cpu,多核心能够执行多个线程.
2.配置大内存,提升内存,便可提升缓存区容量,所以能减小磁盘I/O时间,从而提升响应速度.
3.配置高速磁盘或合理分布磁盘:高速磁盘提升I/O,分布磁盘能提升并行操做的能力.

3.2 优化数据库参数

优化数据库参数能够提升资源利用率,从而提升MySQL服务器性能.MySQL服务的配置参数都在my.cnf或my.ini,下面列出性能影响较大的几个参数.

key_buffer_size:索引缓冲区大小
table_cache:能同时打开表的个数
query_cache_size和query_cache_type:前者是查询缓冲区大小,后者是前面参数的开关,0表示不使用缓冲区,1表示使用缓冲区,但能够在查询中使用SQL_NO_CACHE表示不要使用缓冲区,2表示在查询中明确指出使用缓冲区才用缓冲区,即SQL_CACHE.
sort_buffer_size:排序缓冲区

3.3 分库分表

由于数据库压力过大，首先一个问题就是高峰期系统性能可能会下降，由于数据库负载太高对性能会有影响。另一个，压力过大把你的数据库给搞挂了怎么办？因此此时你必须得对系统作分库分表 + 读写分离，也就是把一个库拆分为多个库，部署在多个数据库服务上，这时做为主库承载写入请求。而后每一个主库都挂载至少一个从库，由从库来承载读请求。

3.4 缓存集群

若是用户量愈来愈大，此时你能够不停的加机器，好比说系统层面不停加机器，就能够承载更高的并发请求。而后数据库层面若是写入并发愈来愈高，就扩容加数据库服务器，经过分库分表是能够支持扩容机器的，若是数据库层面的读并发愈来愈高，就扩容加更多的从库。可是这里有一个很大的问题：数据库其实自己不是用来承载高并发请求的，因此一般来讲，数据库单机每秒承载的并发就在几千的数量级，并且数据库使用的机器都是比较高配置，比较昂贵的机器，成本很高。若是你就是简单的不停的加机器，实际上是不对的。因此在高并发架构里一般都有缓存这个环节，缓存系统的设计就是为了承载高并发而生。因此单机承载的并发量都在每秒几万，甚至每秒数十万，对高并发的承载能力比数据库系统要高出一到两个数量级。因此你彻底能够根据系统的业务特性，对那种写少读多的请求，引入缓存集群。具体来讲，就是在写数据库的时候同时写一份数据到缓存集群里，而后用缓存集群来承载大部分的读请求。这样的话，经过缓存集群，就能够用更少的机器资源承载更高的并发。

结语

一个完整而复杂的高并发系统架构中，必定会包含：各类复杂的自研基础架构系统。各类精妙的架构设计.所以一篇小文顶多具备抛砖引玉的效果,可是数据库优化的思想差很少就这些了.