可扩展性: 经过增长资源提高容量的能力ios
容量能够简单地认为是处理负载的能力,考虑负载可从如下几个角度算法
数据量: 不少应用从不物理删除任何数据,应用所积累的数据量是可扩展的广泛挑战sql
用户量: 更多的用户意味着更多的事务,更多的复杂查询数据库
用户活跃度服务器
相关数据集的大小架构
估算须要承担的负载到底有多少负载均衡
大体正确地估计日程表分布式
应用的功能完成多少工具
预期的最大负载是多少性能
若是依赖系统的每一个部分分担负载,某个部分失效时会发生什么
单台服务器增长各类高性能硬件
烧钱有效的方法
不该该无限制向上扩展
策略: 复制,拆分,数据分片
按功能拆分: 常见作法,根据功能将应用部署在不一样服务器,并使用专用的数据库服务器
数据分片是目前扩展大型MySQL最通用且最成功的方法
应用设计初期考虑到,后期实现就比较容易,不然很难将应用从单一数据存储转换为分片架构
文中举例: 经过用户id来对文章和评论进行分片,而将用户的信息保留在单个节点上
数据库访问抽象层,下降应用和分片数据之间通讯的复杂度
如非必要尽可能不分片
数据分片最大的挑战就是查找和获取数据
相似于表分区,选择分区键和数据分片方式是关键,具体请细查
可使用集群或数据库分布式技术根据场景适当解决一些问题
书中提到技术: NDB Cluster, Clustrix等技术
对再也不须要的数据进行归档和清理
须要考虑对应用的影响
须要考虑数据逻辑的一致性,例如清理A表历史数据时须要考虑全部关联数据的处理
冷热数据分离
可扩展性: 如读写分离时从备库读数据
高效性: 把更多工做分配给更好的机器
可用性: 使用时刻保持可用的服务器
透明性: 客户端无需知道服务器
一致性: 若是应用是有状态的,负载均衡器就应该将相关的查询指向同一个服务器
基于查询分离: 将不能容忍脏数据的查询分配到主库,其余分配到备库
基于脏数据分离: 让应用检查复制延迟,许多报表类应用使用这个策略
基于会话分离: 能够在会话层作一个标记,若是用户修改了数据,则一段时间内老是指向主库
基于版本分离: 给用户的操做增长版本号,检查版本号决定从主库仍是备库读取数据
经过变动DNS名指定的服务器实现
缺点不少,不建议
在服务器之间转移虚拟地址
给服务器分配固定的ip地址,为每一个逻辑上的服务使用一个虚拟ip地址
负载均衡器,如HAproxy
负载均衡算法: 随机, 轮询,最少链接数,最快响应,哈希,权重
服务器池中增长或移除服务器: 在配置链接池中的服务器时,要保证有足够多未使用的容量
高可用性意味着更少的宕机时间
磁盘空间不足
糟糕的sql或者服务器bug引发
糟糕的表和索引设计
复制问题一般因为主备数据不一致致使
衡量指标: 平均失效时间(MTBF), 平均恢复时间(MTTR)
避免问题: 适当的配置,监控和规范
保证在宕机时能快速恢复,系统制造冗余,具有故障转移能力
经过增长冗余避免
共享存储或磁盘复制,若是服务器挂了,备用服务器能够挂载相同的文件系统执行须要的恢复操做
MySQL同步复制
提高备库或切换角色
虚拟IP地址或IP接管: 当MySQL实例失效时能够将IP地址转移到另外一台MySQL服务器上
使用中间件解决方案
在线备份仍是离线备份
逻辑备份仍是物理备份
非显著数据: 如二进制日志和InnoDB事务日志
代码: 存储过程,触发器
服务器配置和复制配置
外部配置,管理脚本
增量备份和差别备份
存储引擎和数据一致性
文件系统中或SAN快照中直接复制数据文件
Percona XtraBackup 作热备份
二级索引损坏: 使用OPTIMIZE TABLE修复损坏的二级索引,此外能够经过构建一个新表重建受影响的索引
聚簇索引损坏: innodb_force_recovery导出表
损坏系统结构: 系统结构包括事务日志等,可能须要作整个数据库的导出和还原,由于InnoDB内部绝大部分的工做可能受影响
工欲善其事,必先利其器
MySQL Workbench: 一站式的工具
SQLyog: 可视化工具之一
Percona Toolkit
MySQL Workbench 工具集
common_schema
MySQL Forge
Nagios
Zabbix: 同时支持监控和指标收集的完整系统
Zenoss: Python写的
Hyperic HQ: 基于Java
主要包括如下功能
事务列表
当前运行的查询
当前锁和锁等待列表
服务器状态和变量汇总信息
InnoDB内部信息
复制监控