mysql学习笔记

时间 2019-11-12

标签 mysql 学习笔记栏目 MySQL 繁體版

原文原文链接

第一章 mysql架构与历史java

mysql 存储引擎架构（程序处理和存储分离）mysql

程序处理：linux

1.query processing 查询处理ios

2. server task 服务处理nginx

存储：web

1.数据存储redis

2.数据提取算法

第一层客户端：认证-->受权-->链接-->每一个链接开单个线程sql

workbench 数据库

https://www.mysql.com/products/workbench/

navicat

https://www.navicat.com/en/products/navicat-for-mysql

第二层

1.查询，优化，分析，缓存：解析树-->优化-->重写Sql,表读取顺序,选择索引(hint 影响优化，explain 查看执行效率)

2. 内置函数

3.其余扩存储引擎的功能：存储过程，触发器，视图

第三层

存储引擎：数据的存储和提取-->存储引擎提供的API

并发控制

锁

1.共享锁(读锁)

2.排它锁(写锁)

锁粒度

1.table lock 表级锁

2.row lock 行级锁

事务

ACID

atom 原子性

consistency 一致性

isolation 隔离性

durability 持久性

隔离级别

read_uncommited 读未提交脏读

read_comminted 读已提交

repeatable read 可重复读 :会产生幻读，innoDb 经过MVCC解决幻读

serializable 可串行化

死锁

1.两个或两个以上事务请求同一资源，并请求锁定对方资源，致使恶性循环现象

好比 A,B两个事务，A须要B的资源 B须要A的资源，A等待B释放锁，B等待A释放锁。无线等待

解决死锁：检查死锁循环依赖抛错

等待超时放弃锁请求

事务中持有最小行级排它锁的事务进行回滚(找一个锁最少的回滚)

事务日志

1.预写入式

mysql 事务默认自动提交

事务是存储引擎实现的

InnoDB 会根据隔离级别自动加锁

锁只在 commit 和 rollback的时候释放

多版本并发控制

不加锁，作相似数据库中的标识字段处理(系统版本号)

mvcc -->行级锁的变种-->避免加锁处理 -->快照-->隐藏记录，保存行数据版本号

mvcc 在 repeatable read 和 read commited隔离级别下使用

MySql存储引擎

查看表的存储引擎

show table status like 'user'

InnoDB是mysql默认的事务存储引擎

InnoDB 默认repeatable read 隔离级别，经过next-key locking(间隙锁) 策略，防止幻读

间隙锁：对索引中的间隙进行锁定，防止幻影行的插入

InnoDB基于聚簇索引创建的，一个表只能有一个聚簇索引（聚簇索引的叶节点就是数据存储的节点），非主键索引必须包含主键列

myISAM存储引擎

nyISAM 不支持事务和行级锁崩溃没法恢复，表级锁支持全文索引，使用 myisampack压缩表（pack 打包）压缩的表示不容许修改的除非解压

myISAM设计简单数据以紧密格式存储某些场景下性能会很好

其余存储引擎：Archive 只支持 insert select 操做适合日志和统计

CSV 存储引擎

存储引擎选择

1.订单处理支持事务的引擎必选

转换表的存储引擎：

alter table user ENGINE=INNODB

第二章 mysql 基准测试

1.为何要进行基准测试 (硬件测试和软件测试)

--软件：

验证系统假设

重现系统异常

测试当前运行状况

模拟比当前系统更高负载

规划将来业务增加

--硬件

测试适应可变环境的能力

测试不一样的硬件、软件和操做系统配置

证实新采购设配配置是否正确

基准测试策略

·1.full-stack : 集成式测试整系统

2.single-component : 单组件式单独测试MySQL

测试指标

1.吞吐量

2.响应时间或延迟

3.并发性

4.可扩展性

基准测试方法

绘图

集成测试工具

单组件测试工具

mysql基准测试套件

第三章服务性能剖析

1. 经过性能剖析进行优化

值得优化的查询

异常状况(执行频率低)

未知

mysql企业监控查询分析功能

mysql企业监控器

剖析mysql查询

剖析服务器负载

捕获查询日志

分析查询日志

查看查询响应时间　　

show profiles

查看单个查询各步骤响应详情

show profile for query 4

预估风险

show status;
show global status;

查看线程链接

show processlist;

　性能降低可能缘由

1.资源过分使用

2.资源没有正确配置

2.资源已损坏或失灵　

第四章　schema与数据类型优化　

字段数据类型选择

1.最小的数据类型更好

2.简单最好：简单数据类型一般占用cpu比较小，整数类型比字符串操做代价低，好比：用MySQL自带日期格式存储，而不是字符串存储日期

3.避免null

整数类型 （）

tinyint 8位

smallint 16位

mediumint 24 位

int 32位

bigint 64位

实数类型 （带小数）

float

double

decimal

字符串类型

varchar 可变长度

char 定长

varchar(5) 和varchar(200) 存储 'hello'空间开销是同样的小的列主要消耗的处理内存少

blob 和text

Blob 二进制存储

tinyblob smallblob blob mediumblob longblob

text 字符存储（有字符集和排序规则）

tinytext smalltext text mediumtext longtext

mysql 会把 blob 和text当作独立对象单独处理

当blob和text值太大时，innoDB会用外部的存储区域来存储值并创建指针(1-4字节) 指向实际值

blob和text所有长度字符不能索引

enum 枚举类型

枚举类型有必定的开销枚举类型和 varchar或char 链接查询可能会慢

日期和时间类型

DateTime 不分时区

范围 1001 - 9999 精度为秒，它把日期和时间分装成YYMMDDHHMMSS 格式的整数中，8字节存储空间

TimeStamp 有时区差别

保存了 1970.01.01 午夜以来的秒数和Unix时间戳相同只能表示到 2038年 4个字节存储空间

mysql 提供 from_unixtime() 将unix时间转化成日期

unix_time()将日期转化成unix时间戳

若是要存储更小级别的时间格式怎么办

使用 bigint 存储微妙级别的时间戳或者使用 double秒以后用小数存储

位数据类型

bit

5.0以前和 tinyint同义以后版本有变化

set

若要保存不少列能够将其和并到一个set 数据类型函数支持：find_in_set() ,field()

缺点：改变列的定使用 alter 代价大，不能使用索引

整数列上按位操做

选择表示符

标识列 identifier column

通常整数类型而后自增 auto_increment

字符串作标识列消耗性能

特殊类型数据

ip 实际是无符号整数，小数点分红4段只是为了更好阅读

MySQL提供函数转换： inet_aton 和 inet_ntoa

-- address to number

SELECT INET_ATON('192.168.1.1');

-- number to address

SELECT INET_NTOA(3232235777);

Mysql schema 设计陷阱

1.应避免太多列

2.应避免太多关联

3.避免过分使用枚举类型

4.避免使用null

范式和反范式

范式的优缺点

优势

1.范式的更新操做一般比反范式快

2.减小数据重复

3.范式话的表一般最小操做快

4.减小使用 distinct

缺点

1.范式一般须要关联

2.范式可能须要拆成多个表

3.多是单表索引策略无效

反范式优缺点

优势

1.表关联较少

2.单表索引策略有效使用

混用范式和反范式

汇总表和缓存表

加快Alter table的速度

1.影子copy : 不提供服务的数据库上进行 alter操做，切换数据库

有些工具能够帮助咱们完成影子 copy:https://launchpad.net/mysqlatfacebook

2.修改字段的默认值有较快的方法：修改 .frm文件

语句为 alter column

（用 modify column效率很低会进行重建表）

只修改 .frm文件

ps：mysql建立表对应目录会建立 .frm文件，用来保存数据表的元信息数据结构定义等，和存储引擎无关数据表必有命名 tableName.frm 如：user.frm

有肯能不须要重建表的操做

1.删除 auto_increment

2.增长、移除或更改 emum ，set 常量值

实现方法 :

1.建立相同结构空表，修改上述常量

2.锁表：flush tables with read lock

3.交换 .frm文件

3.释放锁：unlock tables

高效的载入数据能够先禁用索引载入完成在开启索引

第五章建立高性能索引

简单理解索引：索引到对应值-->找到对应行

索引类型　　

索引在存储引擎层实现没有统一标准

B-tree索引 全部的值都是按顺序存储

B-tree索引加快访问速度

缘由：不须要全表扫描-->索引根节点指针指向-->下一节点-->节点中的值和要查询的值比较-->找到合适的节点进入下层

key1<=值<key2

叶子节点指向被索引数据

B-tree索引限制：不是按照索引最左端查找不能使用索引

哈希索引

索引列计算哈希码

Memery引擎支持哈希索引

哈希索引没法进行排序

不支持部分索引列索引如（A,B）列创建哈希索引，查询只使用A列没法使用索引

哈希索引只支持等值比较不支持范围查询意思是 where price>100用不到索引

有哈希冲突时访问哈希索引速度会变慢

哈希冲突较多维护哈希索引代价较高

InnoDB有自适应哈希：当某些索引值使用频繁 InnoDB会在内存中基于B-tree索引建立一个哈希索引

伪哈希索引例子

数据库中有 url字段该字段B-tree索引性能较低

能够去除 url 现有索引新加一列url_crc 其值为 url对应的哈希值 CRC32('url-value');

用该列进行数据索引查询性能提升

select * from clicks where url_crc=crc32('http://yahoo.com');

　--缺陷 url_crc列须要维护

全文索引

全文索引查找文本中的关键词

索引的优势

三大优势：

1.减小数据扫描数据量

2.索引避免排序和临时表

3.索引能够将随机I/O变为顺序I/O

高性能的索引策略

1.独立的列

2.前缀索引和索引选择性

索引选择性：不重复的索引值也叫基数索引选择性越高查询效率越高

3.多列索引

4.选择合适的索引列顺序

5.聚簇索引是一种存储方式

叶子页存放数据行

聚簇索引优势：

1.相关数据放在一块儿

2. 访问速度快

3.覆盖索引的扫描能够直接使用叶子节点中的主键

缺点：

1.插入速度严重依赖插入顺序

2.聚簇索引更新代价高

3.插入新行或者更新主键肯能致使页分裂

4.可能致使全表扫描变慢

5.二级索引肯能更大二级索引包含主键列

6.二级索引查找须要两次索引

innoDB按组件顺序插入行

uuID 主键插入消耗内存且索引占用空间大

顺序主键并发插入可能致使间隙锁竞争

使用索引扫描来排序

explain 的type 为 index 说明使用索引扫描来排序

前缀压缩索引

myISAM 压缩索引块的方法

1.保留索引块的第一个值

2.其余值和第一值进行比较

如：第一值 ‘perform’ 第二值 ‘performance’ ,前缀压缩：'7,ance'

冗余和重复索引

重复索引 :相同列按相同顺序建立同种类型的索引

能够查询 infomation_schema 来查看重复索引

也能够使用第三方工具 common_schema 来定位

common_schema 安装到服务器上视图来定位

https://code.google.com/archive/p/common-schema/

它比本身查询快

select * from information_schema.statistics where  
TABLE_SCHEMA not in ('mysql','performance_schema','information_schema','common_schema') and table_schema='sunny' and table_name='user';

未使用的索引

索引和锁

索引可使查询锁定更少的行

InnoDB只有访问行的时候才会加锁，索引能给减小InnoDB访问的行数。

范围要放在索引的最后

MySQL使用某个索引进行范围查询就没法在使用另外一个索引进行排序了。

支持多种过滤条件

设计索引时不要只为现有的查询考虑索引，还要考虑对查询进行优化

如咱们在country和sex上建立索引。sex列的选择性显然很低，能够咱们在查询条件中添加 sex in('m','f','o') 来让查询使用该索引

这样作既不会减小过滤行，也不影响返回结果可是提升了查询速度。

可是若是 sex有太多的值 in()列表太长这样作就不行了

避免多个范围条件

修复损坏表

检查表是否损坏

check table user

修复表

repair table user

不是全部的引擎都支持 repair

InnoDB就不支持可使用第三方工具

https://launchpad.net/percona-data-recovery-tool-for-innodb　　

查看索引基数　

show index from user

cardinality：基数

索引列的基数：存储引擎估算索引列有多少不一样取值

减小索引和数据碎片

B-tree索引可能会碎片化索引会无序下降查询效率

碎片化类型：

1. 行碎片化

数据行被存储为多个多个地方的片断

2.行间碎片

3.剩余空间碎片

数据页中大量的剩余空间，致使服务器读取大量不须要的数据

使用 optimize命令优化

optimaize table user

InnoDB不支持该命令

使用 alter命令重建表将表存储引擎改成当前存储引擎

alter table user ENGINE=INNODB

第六章查询性能优化

1.查询所需的列或行不要所有返回

2.去除不须要的关联

3.切分查询

4.避免查询刚更新的数据

5.where 中进行运算取值和运算发生在同一阶段效率高

mysql的查询优化处理

查询优化器

1.重定义表的关联顺序

2.将外链接转化成内链接

3.使用等价变化规则

4.优化count() ,min(),max()

5.预估并转化为常数表达式

6.覆盖索引扫描

7.子查询优化

8.提早终止查询

9.等值传播

10.列表 in()的比较

第七章 MySQL高级特性

分区表

分区表是个独立的逻辑表，但底层由多个物理表组成。

经过对底层表句柄对象的封装实现分区

请求分区表-->句柄对象-->调用存储引擎的接口

mysql实现分区表的方式-->对底层表封装-->索引按照分区表的子表定义没有全局索引

使用 partition by 定义分区存放的数据

allert table exchange partition

分区表将相关数据放在一块儿

1.分区表的做用

表很是大以致于没法所有放在内存
分区表的数据更容易维护
分区表的数据能够分布在不一样的物理设备上
用分区表来避免特殊瓶颈
分区能够独立备份和恢复

2. 分区表的限制

一个表最多有1024个分区
分区表达式必须是整数
若是分区字段中有主键或者惟一索引，主键列和惟一索引必须包含进来
分区表没法使用外键约束

3.分区表的原理

分区表由多个相关底层表实现，底层表由句柄对象表示。

分区表操做逻辑：

select查询

分区层 -->打开并锁住全部底层表-->优化器过滤部分分区-->调用存储引擎接口访问各分区

insert操做

分区层-->打开并锁住全部底层表-->肯定接收数据分区-->向底层表写入数据

delete操做

分区层-->打开并锁住全部表-->肯定分区-->删除底层表数据

update操做

分区层-->打开并锁住全部表-->肯定分区-->取出数据并更新-->肯定updated数据存放分区-->底层表写入-->删除原数据

4.分区表的类型

根据范围进行分区
根据键值进行分区
使用数学模函数进行分区

5.使用分区

要保证大数据量的可扩展性通常有下面两个策略

全量扫描数据不须要任何索引
索引数据并分离热点

6.可能会遇到的问题

null值会使分区过滤无效
分区列和索引列不匹配（没法进行分区过滤）
选择分区的成本可能很高
打开并锁住全部底层表成本很高
维护分区的成本很高

7.查询优化

分区最大的优势：优化器能够根据分区函数过滤一些分区

where 条件中带入分区列

视图

视图是个虚拟表不存听任何数据

不能对视图建立触发器，不能用 drop table 删除视图

1.可更新视图

updatable view 经过视图来更新视图涉及的相关表，删除甚至向视图写入数据

限制条件

若是视图中包含 group by , union ,聚合函数等其余特殊状况就不能更新了
更新中有多表关联语句更新列必须在同一个视图中
临时表算法实现的视图没法被更新

2.视图对性能的yingx

3.视图的限制

mysql不会保存视图定义的原始sql语句

只能从 .frm文件中获取

外键约束

innoDB 是 mysql中惟一支持外键的存储引擎，使用外键有成本修改主表示相应关联表要作查询操做

mysql内部存储代码

触发器
存储过程
函数

优势：

服务内部执行，节省带宽和网络延迟
代码重用，简化应用代码维护
提高安全
服务器端能够缓存执行计划若反复调用下降消耗
应用开发和数据库开发分工

缺点：

mysql未提供好用的开发和测试工具
存储代码使用的函数有限
存储代码可能会带来部署的复杂性
给数据服务器带来太大压力
一个存储过程错误全部应用都没法访问
日志不怎么好用

1.存储过程和函数

2.触发器

定义触发器注意点

每一个表每一事件最多定义一个触发器
mysql只支持行的触发

劣势

触发器掩盖服务器背后的工做，可能不少看不见的工做被触发器执行
触发器问题很难排查
触发器可能致使死锁和等待

3.事件

4.在存储过程当中保存日志

5.游标

MySQL在服务器端提供单向只读游标

6.绑定变量

7.绑定变量优化

每次执行时服务器优化策略：

过滤分区
尽可能移除 count() ,min().max()
移除常数表达式
检测常量表
作必要的等值传播
分析和优化 ref ,range 索引优化访问数据
优化管理顺序

8.插件

存储过程插件，后台插件，全文解析插件，审计插件，认证插件

9.字符集

二进制编码到某类字符的映射

使用 collate 来指定字符串的字符集

select _utf8 'hello' collate utf8_bin;

解决字符集问题

1.alter table将对应列转成兼容的字符集

2.还可使用编码前缀和 collate子句将列转换成兼容的编码

字符集校对规则消耗内存

10.全文索引

全文索引支持各类字符内容的搜索，也支持天然语言的搜索

myISAM全文索引也是一种特殊的B-tree索引分为两层

关键字
文档指针

11.天然语言全文索引

关键字整个索引中出现的次数越少匹配相关度越高

12. 布尔全文索引

myISAM引擎才能使用布尔全文索引

13.全文索引的限制

insert,update,delete全文索引的代价很大：
修改文本100个单词须要100次索引操做
列的长度影响全文索引的性能
全文索引会有更多的碎片可能须要更多的 optimize table
全文索引影响优化器的工做

使用全文索引时返回主键值当程序真的须要数据时再查使用其余索引

14.全文索引的配置和优化

保证索引缓存足够大

保证索引可以缓存在内存中

为全文索引设置单独的键缓存(key cache)

创建停用词表

忽略过短的单词

15.分布式事务

16.内部XA事务

跨存储引擎的事务

17.外部事务

18.查询缓存

19.如何判断缓存命中

查询有一些不肯定数据时，则不会被缓存如：now(),current_date()

查询中包含任何用户自定义的函数、用户变量、临时表或者包含列权限级别的表都不会被缓存

缓存也会带来必定开销：

缓存检查
缓存数据添加
数据插入时缓存失效

20.查询缓存对内存的使用

查询缓存彻底存储在内存中的

查询缓存的内存分红变长的数据块

数据块自身有类型大小和数据自己

数据块类型有：存储 -> 查询结果、查询、数据表映射、查询文本等

21.查询缓存配置

query_cache_type

query_cache_size

query_cache_min_res_unit

query_cahce_limit

query_cache_wlock_invalidate

查询缓存空间过小查询缓存使用率会很低

22. InnoDB缓存机制

innoDB有mvccjizhi 因此使用缓存更复杂

当前事务ID-->内存中数据字典事务ID号(计数器)比较-->大于计数器的ID号才可使用缓存 -->若是表上有任何锁不可使用缓存-->事务提交-->当前系统事务ID 修改该表计数器

23.查询缓存优化

多个小表代替一个大表对缓存有帮助
批量写入只须要作一次缓存失效，效率高于单条写入
因缓存空间太大因此要控制缓存大小防止过时操做服务器僵死
能够经过 sql_cahe 和sql_no_cahe来控制查询是否须要缓存
对于密集型的应用关闭缓存能够提升系统性能
由于互斥信号量的竞争关闭查询缓存对读密集型的应用也会有好处能够测试打开和管查询缓存性能差别

第八章优化服务器设置

1.mysql配置的工做原理

配置文件通常在 /etc/my.cnf 或者 /etc/mysql/my.cnf

2.mysql 基础配置文件

2.配置缓冲池和日志文件 由于默认过小了

缓冲池流行的经验是设置为服务器内存的 75% - 80%

更好的办法：

( 内存总量 - 系统内存占用 - mysql自身须要内存 - 操做系统缓存innoDB日志文件所需内存 - 其余配置缓冲或缓存所需内存如 key cache ,query cache )

/ 1.05(InnoDB 缓冲池自身开销)

结果四合五入

3.配置内存使用

内存消耗

能够控制的内存：能够经过参数配置的内存

不能够控制的内存：mysql服务运行、解析查询、内部管理消耗等

配置内存步骤

肯定内存使用上限
肯定mysql每一个链接所需内存：如排序缓冲和临时表
肯定操做系统须要多少内存才够用
把剩下的内存所有给mysql缓存

重要的缓存

InnoDB缓冲池
InnoDB日志文件和myISAM数据系统缓存
MyisAM键缓存
没法手工配置的缓存如二进制日志表定义文件的操做系统缓存

innoDB缓冲池

缓存索引缓存行数据自适应hash ,insert buffer ,锁，以及其余内部数据结构，缓冲数据延迟写入实现合并写入。

缓冲池太大预热和关闭消耗时间关闭以前须要把脏页写回数据库

查看脏页数 Innodb_buffer_pool_pages_dirty

show global status;

innodb_max_dirty_pages_pct 刷新脏页数阀值

show variables

key cache

键缓存只缓存索引

不超过索引总大小

或者不超过操做系统缓存总内存的 25% - 50%

缓冲区的使用率公式

100-（（key_block_unuser * key_cache_block_size）*100/key_buffer_size）;

show global status where variable_name in('Key_blocks_unused','Key_cache_block_size','Key_buffer_size');
show variables where variable_name in('Key_blocks_unused','Key_cache_block_size','Key_buffer_size');

100 -（6582 * 1024）*100/16777216=59.82666

key block size

mysql键缓存块的大小

InnoDB事务日志

innoDB使用日志减小事务提交开销 -->InnoDB把随机I/O变成顺序I/O--> 日志写入磁盘 -->事务持久化

-->日志恢复已提交的事务

日志文件大小

innoDb_log_file_size, innoDb_log_files_in_group

show variables where variable_name like'Innodb_log%'

size=2*167772160

日志缓冲区 innodb_buffer_size 推荐大小为 1M - 8M

show VARIABLES where variable_name like'innodb_log%'

16777216 这是默认的大小咱们来算一下多少M

16777216 B/1024/1024=16M

InnoDB表空间

InnoDB把数据保存在表空间内，本质上是由一个或多个磁盘文件组成的虚拟文件系统。

InnoD

存储表索引
保存回滚日志
插入缓冲
双写缓冲

　innoDb_data_file_path 配置表空间文件

这些文件存放在 innodb_data_home_dir 指定的目录

show VARIABLES where variable_name like'innodb_data%';

autoextend：超过度配空间还能增加

max:设置上限如：ibdata1:12M:autoextend:max:2G

innodb_file_per_table 设置innoDb每一个表使用一个表空间文件

show VARIABLES where variable_name like'innodb_file%';

innodb_file_per_table on

优势：易于管理

缺点：删除表慢能够先将.ibd指向 0字节文件而后手动删除表文件

删除表须要扫描缓冲池找到属于表空间的页面

InnDb双写缓冲 DoubleWrite buffer

双写缓冲避免页没写完整致使的数据损坏

innodb_doublewrite

配置mysql并发

innodb_thread_concurrency 控制线程并发数 0为不限制

show VARIABLES where variable_name like'innodb_thread%';

理论上的配置

并发值=cpu数量 * 磁盘数量 * 2;

实践中小于理论中且须要验证

innodb_thread_sleep_delay 微妙线程休眠时间当并发值 >=设置值线程delay 而后重试若是还不能进入内核则会进入等待队列

innodb_concurrency_tickets 线程进入内核会有必定量 ticket供其免费返回内核不须要并发检测

show VARIABLES where variable_name like'innodb_concurrency%';

innodb_commit_concurrency 并发提交量 0 不限制

MyIsAM 并发配置

myIsAM 设置 concurrent_insert 　控制并发

0 不容许并发插入

1　默认值没有空洞就容许并发插入

2 插入表的末尾即便有空洞

delay_key_write 延迟写索引

优化 Blob和 text

1.使用 substring()函数

优化排序

使用 max_length_for_sort_data

第九章操做系统和硬件优化

cpu和I/O资源影响mysql性能

调优服务器的目标

低延时
高吞吐

cpu架构

多个cpu和核心

cpu联机处理事务 OLTP on-line transaction processing

数据库并发问题

逻辑并发问题

应用程序能够看到的资源竞争：表和行的锁争用

2.内部并发问题

平衡内存和磁盘资源

高速缓存

随机I/O和顺序I/O

顺序I/O比随机I/O快

存储引擎执行顺序比随机读取快

缓存，读和写

屡次写入一次刷新

I/O合并

工做集

完成某某项工做所须要的数据集

工做集包括索引和数据

选择硬盘

传统磁盘读取数据步骤：

移动读取磁头到正确位置

等待磁盘旋转，磁头读取数据

磁盘选择

存储容量
传输速度
访问时间(随机查找速度)
主轴转速(15000RPM)
物理尺寸（其余条件相同物理尺寸越小读取磁头时间越短）

固态存储

使用非易失性闪存芯片组成，NV RAM

SSD固态硬盘

PCle卡

SSD经过实现SATA（串行高级技术附件）接口模拟标准硬盘能够直接代替硬盘驱动插入现有卡槽

高质量闪存设备应具有：

相比硬盘有更好的随机读写性能
相比硬盘有更好的顺序读写性能
相比硬盘有更好的支持并发

闪存

闪存读取快写入慢且要作好垃圾回收技术

闪存有两种技术

SLC 单层单元
MLC 多层单元

flashcache

flashcache是linux内核模块使用linux设备映射他在内存和磁盘之间创建一个中间层是facebook开源和使用技术之一。能够优化数据库负载

RAID:磁盘冗余队列

为备份库选择硬件

备份库主要考虑的是成本

RAID 磁盘冗余队列优化

网络配置

tcp的积压 back_log配置 tcp队列大小

文件系统

线程

GNU/Linux 提供两种线程库

LinuxThreads
原生Posix（NPTL）

NPTL更轻量更高效

操做系统状态

vmstat 5

vmstat : vm stat工具 5s 打印一次报告

　procs :r 显示多少进程正在等待

b 显示多少进程正在不可中断的休眠（等待 I/O 等待网络等待用户输入等）

memory:

swpd 页面交换

free 空闲

buff 缓冲

cache 操做系统缓存

system:

in:每秒中断

cs:上下文切换

iostat -dx 5

io stat 查看 io信息

rrqm/s和wrqm/s

每秒合并的读写请求

r/s和w/s

每秒发送到设备的读写请求

rsec/s 和 wsec/s

每秒读和写的扇贝数

avgrq -sz

请求的扇贝数

avgqu -sz

设备队列中的等待请求数

await

队列等待

svctm

请求花费秒数

%util

活跃请求所占时间百分比

设备并发请求数

　concurrency=(r/s+w/s)*(svctm/1000);　

第10章复制

复制概述

复制解决的基本问题是让一台服务器的数据和另外一台服务器数据保持同步一台主库数据同步到多台备份库。

mysql两种复制方式

基于行的复制
基于语句的复制

复制解决的问题

复制的用途

数据分布
负载均衡
备份
高可用性和故障切换

如何复制

主库-->binary log-->备份库relay log-->备份库读取relay log重放数据

每一个备份库在主库上 -->各自建立线程执行 binlog dump命令 -->读取主库二进制文件将数据发送给备库

binlog dump不共用

复制有三个步骤

主库上把数据更改记录到二进制日志 binary log （二进制日志事件）
备份库将主库上的日志复制到本身的中继日志（relay log）
备份库读取中继日志事件将其重放在备份库中

配置复制

每台服务器建立复制帐号
配置主库和备份库
通知备库链接到主库从主库复制数据

sync-binlog=1

发送复制事件到其余设备

复制过滤器

容许复制服务器上部分数据：重放的时候进行过滤

复制拓扑

一个mysql备库实例只能有一个主库
每一个备库必须有一个惟一服务器ID
一个主库能够有多个备库
若是打开了 log_slave_updates选项备库能够把主库上数据变化传播到其余备库

一主多备

少许写大量读的时候很是有用

双主复制

两台服务器每一个都设置成对方的主库和备库

最大的问题是解决数据冲突

mysql不支持多主复制

被动模式下的主-主复制

其中一台服务器是只读的被动服务器

配置主-主服务器对

确保两台服务器上数据相同
启用二进制日志，主库设置惟一服务器ID 并建立复制帐号
启用备库更新日志记录，这是故障转移和故障恢复的关键
把被动服务器配置成只读 (可选)
启动每一个服务器的Mysql实例
将每一个主库设置成对方的备库，使用新建立的二进制日志开始工做

拥有备库的主-主结构

为每一个主库增长一个备库

环形复制

每一个服务器是它以前服务器的主库，是它以后服务器的主库

主库分发主库备份库

分发主库减小备份库建立线程 binlog dump 对主库内存的消耗，专门负责分发

设置 slave_compressed_protocal 节约主库带宽

分发库上每一个表的存储引擎必须是 blackhole

树或金字塔型

优势减轻主库负担

缺点中间层出错影响节点下面多个服务器

选择性复制

将主库中的数据--.> 划分到不一样的数据库里-->数据库备份到不一样备份库

监控复制

show  master logs

show binlog EVENTS

　查看复制事件

备库提高为主库

备库追遇上主库(数据)
中止向老的主库写入
将备库配置为新的主库
写操做指向新的主库，开启主库写入

肯定主备是否一致

checksum table 来检测

checksum table user;

可是当复制正在进行时这种方法是不可行的

使用 pt-table-checksum 工具

数据损坏或丢失

主库意外关闭

设置sync_binlog
指定备库从下一个二进制日志开头读(部分日志事件将永久丢失)
使用pt-table-checksum 来检查主备一致性以便数据修复

备库意外关闭

使用pt-slave-restart工具查找上次中止的位置

主库上的二进制日志损坏

忽略损坏位置
flush logs建立新日志文件
备库指向新文件开始位置

备库上的中继日志损坏

若主库日志无缺使用change master to 命令丢弃并从新获取事件

二进制日志与innoDB事务日志不一样步

没法修复

数据改变但事件还是有效的sql

没法修复

数据改变且事件是无效的sql

忽略

数据遗漏事件长度是错误的

忽略找下个事件的开始

第11章可扩展的mysql

可扩展性

容量：最大吞吐量不是容量容量是有效利用量

向上扩展（垂直扩张）

强悍的硬件内核 cpu

水平扩展

复制
拆分
数据分片

最简单的是加服务器

工做负载分布到多个节点

按功能拆分

功能被捆绑到单个mysql，就只能垂直扩张。其中一个功能很是庞大应寻求不一样策略

数据分片

目前扩展大型mysql的应用方案中数据分片是最通用且最成功的方法

将数据切割成写块存储到不一样的节点。

公共服务不拆分，数据庞大增加快的部分进行数据分片或许可使用面向服务架构

选择分区键

多个分区键

跨分片查询

分配数据分片和节点

分片和节点不必定是一对一分片的大小应小于节点容量这样就能够在单个节点存储多个分片

分片小易于管理易于数据恢复

节点上部署分片

每一个分片使用使用一个数据库表名包含分片号：查询语句须要从新使用占位符
每一个节点运行多个mysql实例每一个实例上有一个或多个分片
每一个分片各自使用一个数据库数据库名要相同
每一个分片使用使用一个数据库数据库名包含分片号，代表不包含分片号

固定分配

数据分配到分片有两种方法

固定分配
动态分配

固定分区优势：简单开销低甚至能够硬编码

缺点：

若是分片很大数量很少很难平衡不一样分片间的负载
固定分片没法自定义数据放在哪一个分片有些数据可能比其余数据活跃也许被分配到同一个片内各个分片间的负载不均衡
修改分片策略比较困难

动态分配

将每一个数据单元映射到分片如创建一个分区函数表

给定用户ID 获取分片号存储数据

混合动态分配和固定分配

显示分配

从新均衡分片数据

生成全局惟一ID

1.auto_increment

能够在一台auto_increment_offset 设置为 1 auto_increment_increment 设置为2

那就是从1 开始每次增加 2 1,3,5,7,9.....全为奇数

另外一台auto_increment_offset 设置为 2 auto_increment_increment 设置为2

那就是从2 开始每次增加 2 2,4,6,8,10.....全为偶数

2.全局节点中建立表

在全局数据节点中建立表生成惟一ID

3.使用 redis或memcached

4.批量分配数字（号段）

5.复合值如分片号+自增ID

6.UUID

分片工具

经过多实例扩展

mysql 不能彻底发挥硬件性能，当扩展超过24个cpu时 mysql性能趋于平缓当内存超过128G也一样如此

经过集群扩展

nosql

cap: 一致性（consistency）、可用性（Availability）、分区容错（partition-tolerance）

保持活跃数据独立

负载均衡

一个服务器群尽量平均负载一般设置负载均衡器

负载均衡的目的

可扩展性
高效性
可用性
透明性
一致性

引入中间件

中间件能够是硬件也能够是软件中间件派发请求到指定服务器并把执行结果发送给请求机器

负载均衡器

负载均衡算法

可用方法

随机
轮询
最少链接数
最快响应
哈希
权重

第12章高可用性

更少的宕机时间

宕机的缘由

35% 环境问题：磁盘空间耗尽
35%性能问题：垃圾sql 还有些bug或错误 bad schema 和索引设计
20%复制：主库和备库数据不一致
10% 数据丢失或损坏：手动删除误操做

如何实现高可用性

避免宕机 1. 对宕机的缘由进行配置和监控：平均失效时间 MTBF

2.发生宕机时要快速恢复：平均恢复时间 MTTR

避免单点失效

增长冗余 1.增长冗余量 2.重复组件

共享存储或磁盘复制

优势：

避免数据丢失，为非存储组件创建冗余

减小系统部分需求提升组件高可用性

缺点

mysql崩溃文件损坏备库受影响

共享存储建议使用 innodb引擎 ACID

中间件解决方案

可使用代理端口转发网络地址转换（NAT）或者硬件的负载均衡来实现故障转移和恢复

第13章云端的mysql

粗略分为两类

Iaas:基础设施及服务

Iaas 用于托管Mysql服务器的云端基础架构

Dbaas 数据库及服务

mysql自己做为云端管理资源用户收到mysql服务器的访问许可才能访问如 amazon运行的mysql rds 其中一些服务器并不是真实的mysql 但其兼容MySQL协议和查询

云的优缺点

优势：

减小管理和运维成本

缺点：

资源共享不可预测
虚拟的共享资源排查故障困难

四种基础资源

cpu周期
内存
I/O
网络

第14章应用层优化

sql语句优化

创建了不必的链接

链接池是否合理

是否保持长链接

web服务器问题

不要使用apche作静态内容服务可使用 nginx 或 lighttpd

不要让Apache填鸭式服务客户端

不要为长距离链接 apache 启用 keep-alive 这样会使重量级进程存活很长时间

寻找最优并发度

缓存

一般缓存越接近客户端，节省资源效率越高

主动缓存

被动缓存 memcached

应用缓存有多种：

本地缓存
本地共享内存缓存
分布式内存缓存
磁盘上的缓存

缓存控制策略

TTL time to live 存活时间：设置一个过时时间
显示失效：更新数据时使缓存失效
读时失效

handlerSocket 和msmcached

hadoop

第15章 mysql备份与恢复

逻辑备份

物理备份

增量备份

差别备份

文件快照是一种很是好的在下备份方法

1. MySQL 学习笔记
2. MySQL学习笔记
3. mysql 学习笔记
4. mysql学习笔记
5. Mysql----学习笔记
6. Mysql学习笔记
7. MySql学习笔记
8. Mysql 学习笔记
9. MYSQL学习笔记
10. MySQL-学习笔记
更多相关文章...
• 您已经学习了 XML Schema，下一步学习什么呢？ - XML Schema 教程
• 我们已经学习了 SQL，下一步学习什么呢？ - SQL 教程
• Tomcat学习笔记（史上最全tomcat学习笔记）
• 适用于PHP初学者的学习线路和建议