1, mysql的复制原理以及流程。mysql
(1)先问基本原理流程,3个线程以及之间的关联。sql
(2)再问一致性,延时性,数据恢复。数据库
(3)再问各类工做遇到的复制bug的解决方法缓存
(1) 问5点不一样服务器
1>.InnoDB支持事物,而MyISAM不支持事物网络
2>.InnoDB支持行级锁,而MyISAM支持表级锁架构
3>.InnoDB支持MVCC, 而MyISAM不支持并发
4>.InnoDB支持外键,而MyISAM不支持分布式
5>.InnoDB不支持全文索引,而MyISAM支持。(X)函数
(1)varchar与char的区别
char是一种固定长度的类型,varchar则是一种可变长度的类型
(2)varchar(50)中50的涵义
最多存放50个字符
(3)int(20)中20的涵义
int(M)中的M indicates the maximum display width (最大显示宽度)for integer types. The maximum legal display width is 255.
(4)为何MySQL这样设计?
(1)有多少种日志
错误日志:记录出错信息,也记录一些警告信息或者正确的信息
慢查询日志:设置一个阈值,将运行时间超过该值的全部SQL语句都记录到慢查询的日志文件中。
二进制日志:记录对数据库执行更改的全部操做
查询日志:记录全部对数据库请求的信息,不论这些请求是否获得了正确的执行。
(2)日志的存放形式
(3)事务是如何经过日志(undo log ,redo log)来实现的,说得越深刻越好。
隔离性: 经过 锁 实现
原子性、一致性和持久性是经过 redo和undo来完成的。
(1)各类日志格式的涵义
(2)适用场景
(3)结合第一个问题,每一种日志格式在复制中的优劣。
(1) 没有经验的,能够不问
(2)有经验的,问他们的处理思路
(1)explain出来的各类item的意义
(2)profile的意义以及使用场景。
(3)explain中的索引问题。
(1) 备份计划
(2)备份恢复时间
(3)备份恢复失败如何处理
11, innodb的读写参数优化
(1)读取参数,global buffer pool以及 local buffer
(2)写入参数
(3)与IO相关的参数
(4)缓存参数以及缓存的适用场景
12 ,请简洁地描述下MySQL中InnoDB支持的四种事务隔离级别名称,以及逐级之间的区别?
SQL标准定义的四个隔离级别为:
read uncommited :读到未提交数据
read committed :脏读,不可重复读
repeatable read :
serializable :串行事物
Read Uncommitted(读取未提交内容)
在该隔离级别,全部事务均可以看到其余未提交事务的执行结果。本隔离级别不多用于实际应用,由于它的性能也不比其余级别好多少。读取未提交的数据,也被称之为脏读(Dirty Read)。
Read Committed(读取提交内容)
这是大多数数据库系统的默认隔离级别(但不是MySQL默认的)。它知足了隔离的简单定义:一个事务只能看见已经提交事务所作的改变。这种隔离级别也支持所谓的不可重复读(Nonrepeatable Read),由于同一事务的其余实例在该实例处理其间可能会有新的commit,因此同一select可能返回不一样结果。
Repeatable Read(可重读)
这是MySQL的默认事务隔离级别,它确保同一事务的多个实例在并发读取数据时,会看到一样的数据行。不过理论上,这会致使另外一个棘手的问题:幻读(Phantom Read)。简单的说,幻读指当用户读取某一范围的数据行时,另外一个事务又在该范围内插入了新行,当用户再读取该范围的数据行时,会发现有新的“幻影” 行。InnoDB和Falcon存储引擎经过多版本并发控制(MVCC,Multiversion Concurrency Control 间隙锁)机制解决了该问题。注:其实多版本只是解决不可重复读问题,而加上间隙锁(也就是它这里所谓的并发控制)才解决了幻读问题。
Serializable(可串行化)
这是最高的隔离级别,它经过强制事务排序,使之不可能相互冲突,从而解决幻读问题。简言之,它是在每一个读的数据行上加上共享锁。在这个级别,可能致使大量的超时现象和锁竞争。
对于不一样的事务,采用不一样的隔离级别分别有不一样的结果。不一样的隔离级别有不一样的现象。主要有下面3种如今:
一、脏读(dirty read):一个事务能够读取另外一个还没有提交事务的修改数据。
二、非重复读(nonrepeatable read):在同一个事务中,同一个查询在T1时间读取某一行,在T2时间从新读取这一行时候,这一行的数据已经发生修改,可能被更新了(update),也可能被删除了(delete)。
三、幻像读(phantom read):在同一事务中,同一查询屡次进行时候,因为其余插入操做(insert)的事务提交,致使每次返回不一样的结果集。
不一样的隔离级别有不一样的现象,并有不一样的锁定/并发机制,隔离级别越高,数据库的并发性就越差,4种事务隔离级别分别表现的现象以下表:
隔离级别 | 脏读 | 非重复读 | 幻像读 |
read uncommitted | 容许 | 容许 | 容许 |
read committed | 容许 | 容许 | |
repeatable read | 容许 | ||
serializable |
13,表中有大字段X(例如:text类型),且字段X不会常常更新,以读为为主,请问
(1)您 是选择拆成子表,仍是继续放一块儿?
(2)写出您这样选择的理由?
14,MySQL中InnoDB引擎的行锁是经过加在什么上完成(或称实现)的?为何是这样子的
15 MyISAM 与innodb的区别
1. MySQL中控制内存分配的全局参数,有哪些?(注:至少写6个以上)
1>. Key_buffer_size
2>. innodb_buffer_pool_size
3>. innodb_additional_memory_pool_size
4>. innodb_log_buffer_size
5>. query_cache_size
6>.read_buffer_size
7>.read_rnd_buffer_size
2. 请简洁地描述下MySQL中InnoDB支持的四种事务隔离级别名称,以及逐级之间区别?
Read uncommitted: 在该隔离级别,全部事务均可以看到其余未提交的事务的执行结果。读取未提交的事务,称之为“脏读”。
Read Committed:一个事务只能看见已经提交事务所作的改变。由于同一事务的其余实例在该实例处理其间可能会有新的commit,因此同一select可能返回不一样结果。
Repeatable Read:这是MySQL的默认事务隔离级别,它确保同一事务的多个实例在并发读取数据时,会看到一样的数据行。这种级别会出现幻读。
Serializable:这是最高的隔离级别,它经过强制事务排序,使之不可能相互冲突,从而解决幻读问题
它们之间的区别以下表:
隔离级别 |
脏读 |
非重复读 |
幻像读 |
Read uncommitted |
容许 |
容许 |
容许 |
Read Committed |
|
容许 |
容许 |
Repeatable Read |
|
|
容许 |
Serializable |
|
|
|
3. 小题集锦
1>.VARCHAR(N) 或 CHAR(N)中的N含义是:
N的含义表示N个字节。前者是变长,N的范围是 0~65535,后者是固定长度,N的范围是0~255。
2>.若一张表中只有一个字段VARCHAR(N)类型,utf8编码,则N最大值为多少(精确到数量级便可):
因为utf8的每一个字符最多占用3个字节。而MySQL定义行的长度不能超过65535,所以N的最大值计算方法为:(65535-1-2)/3。减去1的缘由是实际存储从第二个字节开始,减去2的缘由是由于要在列表长度存储实际的字符长度,除以3是由于utf8限制:每一个字符最多占用3个字节。
所以N=(Floor(65535-1-2)/3)
3>.表中有大字段X(例如:text类型),且字段X不会常常更新,以读为为主,请问您
是选择拆成子表,仍是继续放一块儿,而且写出您的理由?
答案:拆成子表
理由:能够提升其余字段查询和更新的效率,由于每页保存的行数越多,效率会越高。大字段X更新率低,单行读取时效率影响不大。但若是读取的行数越多,影响会越大。所以选择拆成子表更好。
4>.MySQL中InnoDB引擎的行锁是经过加在什么上完成(或称实现)的:
A. 数据块
B. 索引值
选择答案后,告诉咱们为何?
答:B。innodb表数据是索引组织表形式存放
5>.username字段定义为VARCHAR(40)和VARCHAR(200)有啥区别?
答:临时表varchar(200)占用空间更大
5>.MySQL数据库备份方式有那几种(只讨论InnoDB存储引擎),至少写四种。
1>.热备份
2>.冷备份
3>.温备份
4>.二进制日志备份
4. MySQL复制搭建M->N的过程,请简述各个步骤?(备注:M已经在线跑,N为新安装的MySQL服务器)
1> .在启动主从服务器时,必须用server_id启动选项给出其ID值。主从服务器的ID值不能相同。主服务器启动二进制日志。
2>.在主服务器上,建立一个帐户供从服务器链接主服务器并请求修改信息。
3>.链接到主服务器并经过执行showmaster status 语句肯定当前的复制坐标。
4>.在从服务器上为将被复制的数据库创建一份完备的副本。
5>.链接到从服务器并使用changemaster 语句来配置它,包括把用来链接主服务器的参数和初始化复制坐标告诉从服务器。
6>.从服务器开始复制。
5. 看图分析(申明:应用程序未有任何版本变动)
1>.图出现什么样的现象,及现象之间的关联性?
图一表示当前处于锁等待的事务数从07:30到09:30急剧增长。图二表示当前等待写入到磁盘的数据量在19:00到01:00之间很是多,并在22:00达到峰值。
之间的联系:图二是因,图一是果。
2>.经过图信息分析得出可能什么缘由形成的?
服务器宕机
3>.分析出缘由后,告知如何解决?
答:宕机的缘由太多。要查看数据库日志文件和操做系统日志来具体分析。
4>.请简述你是如何思考分析的?
答:两幅图的之间的关系要从时间轴来分析,考虑来龙去脉。
6. SQL语句优化
原SQL语句:
SELECTID,WAYBILL_NO,EXP_TYPE,PKG_QTY,EXPRESS_CONTENT_CODE,EFFECTIVE_TYPE_CODE
FROM T_EXP_OP WHERE ORDERID NOT IN(SELECTORDERID FROM T_EXP_OP WHERE AUX_OP_CODE IN ('NEW','UPDATE','DELETE') AND((OP_CODE IN (176, 162, 171, 131, 136)AND EXP_TYPE IN ('10', '20', '30')) OR(OP_CODE IN (191, 121)AND EXP_TYPE IN ('10', '20')) OR (OP_CODE IN (181,111)AND EXP_TYPE = '10'))) LIMIT 10;
条件:
T_EXP_OP表主键为BIGINT类型的ID字段,存储引擎为InnoDB,无其余索引
优化后为(提示:优化成一条简单的SQL语句,即无子查询,无JOIN关联):
SELECT ID, WAYBILL_NO, EXP_TYPE, PKG_QTY,EXPRESS_CONTENT_CODE, EFFECTIVE_TYPE_CODE
FROM T_EXP_OP
WHERE
AUX_OP_CODENOT IN (‘NEW’, ‘UPDATE’, ‘DELETE’)
AND(OP_CODE NOT IN (176, 162, 171, 131, 136, 191, 121, 181,111)
ANDEXP_TYPE NOT IN(‘10’, ‘20’, ‘30’))
LIMIT 10;
7. 分页SQL语句优化
原SQL语句:
SELECT * FROM test FORCE(idx_m_n) WHEREm=1 ORDER BY n LIMIT 1000,10;
条件:
Test表为InnoDB存储引擎,主键为BIGINT类型的ID字段,二级索引:idx_m_n(m,n)
优化后为:
索引要修改成: idx_m_n(m,n,ID);
SELECT a.* FROM test a
inner join
(SELECT ID FROM test FORCE(idx_m_n) WHEREm=1 ORDER BY n LIMIT 1000,10 ) b
on a.id=b.id
请简述优化的理由:
1>.二级索引中没有ID字段,没法达到最优化
2>.采用多表链接,效率会更高
3>.
8. 语句挑错
SQL语句:
SELECTM.columnname……,N.* columnname…..
FROMleft_table M LEFT JOIN right_tableN
ON M.columnname_join=N. columnname_join ANDN. columnname=XXX AND M.columnname=XXX
请问本SQL语句哪里不合理,为啥不合理?
答:N.* columnname….. 应该改成N.columnname……
空格符有明显错误,如:M. columnname_join应改成:M.columnname_join,N.columnname_join, N. columnname同理。
9. [SELECT *] 和[SELECT 所有字段]的2种写法有何优缺点,至少写出四点
1>.前者要解析数据字典,后者不须要
2>.结果输出顺序,前者与建表列顺序相同,后者按指定字段顺序。
3>.表字段更名,前者不须要修改,后者须要改
4>.后者能够创建索引进行优化,前者没法优化
5>.后者的可读性比前者要高
10. HAVNG 子句 和 WHERE的异同点,至少写出3点
1>.语法上:where 用表中列名,having用select结果别名
2>.影响结果范围:where从表读出数据的行数,having返回客户端的行数
3>.索引:where 可使用索引,having不能使用索引,只能在临时结果集操做
4>.where后面不能使用汇集函数,having是专门使用汇集函数的。
11. 分布式数据库产品的特色(至少写4条)
1>.数据分布在多个异地点,抗灾性强
2>.并发性高
3>.受网络影响很大
4>.单机的性能不是特别重要,可是整体成本很高。
5>.扩展性强
12. 数据拆分架构的优缺点(至少写8条)
1>.透明性,程序不须要作任何修改
2>.解决集中数据库的扩展局限性。实现水平扩展问题,涉及到数据的拆分问题
3>.提升数据库服务的性能、可靠性、可用性
4>.实现技术不难,开发成本和维护成本可控
5>.测试成本高
6>.没法支持分布式事务
7>.数据拆分后数据合并难
8>.部分功能限制
9>.扩展受限