MySQL 面试题目

时间 2019-11-09

标签 mysql 面试题目栏目 MySQL 繁體版

原文原文链接

1， mysql的复制原理以及流程。mysql

（1）先问基本原理流程，3个线程以及之间的关联。sql

（2）再问一致性，延时性，数据恢复。数据库

（3）再问各类工做遇到的复制bug的解决方法缓存

2，mysql中myisam与innodb的区别，至少5点。

（1）问5点不一样服务器

1>.InnoDB支持事物，而MyISAM不支持事物网络

2>.InnoDB支持行级锁，而MyISAM支持表级锁架构

3>.InnoDB支持MVCC, 而MyISAM不支持并发

4>.InnoDB支持外键，而MyISAM不支持分布式

5>.InnoDB不支持全文索引，而MyISAM支持。（X)函数

（2）问各类不一样mysql版本的2者的改进
（3）2者的索引的实现方式

3，问mysql中varchar与char的区别以及varchar(50)中的30表明的涵义。

（1）varchar与char的区别

char是一种固定长度的类型，varchar则是一种可变长度的类型

（2）varchar(50)中50的涵义

最多存放50个字符

（3）int（20）中20的涵义

int(M)中的M indicates the maximum display width (最大显示宽度)for integer types. The maximum legal display width is 255.

（4）为何MySQL这样设计？

4，问了innodb的事务与日志的实现方式。

（1）有多少种日志

错误日志：记录出错信息，也记录一些警告信息或者正确的信息

慢查询日志：设置一个阈值，将运行时间超过该值的全部SQL语句都记录到慢查询的日志文件中。

二进制日志：记录对数据库执行更改的全部操做

查询日志：记录全部对数据库请求的信息，不论这些请求是否获得了正确的执行。

（2）日志的存放形式

（3）事务是如何经过日志(undo log ,redo log)来实现的，说得越深刻越好。

隔离性：经过锁实现

原子性、一致性和持久性是经过 redo和undo来完成的。

5，问了mysql binlog的几种日志录入格式以及区别

（1）各类日志格式的涵义

（2）适用场景

（3）结合第一个问题，每一种日志格式在复制中的优劣。

6，问了下mysql数据库cpu飙升到500%的话他怎么处理？

（1）没有经验的，能够不问

（2）有经验的，问他们的处理思路

7，sql优化。

（1）explain出来的各类item的意义

（2）profile的意义以及使用场景。

（3）explain中的索引问题。

8, 备份计划，mysqldump以及xtranbackup的实现原理，

（1）备份计划

（2）备份恢复时间

（3）备份恢复失败如何处理

9， 500台db，在最快时间以内重启。

10，在当前的工做中，你碰到到的最大的mysql db问题是？

11， innodb的读写参数优化

（1）读取参数，global buffer pool以及 local buffer

（2）写入参数

（3）与IO相关的参数

（4）缓存参数以及缓存的适用场景

12 ，请简洁地描述下MySQL中InnoDB支持的四种事务隔离级别名称，以及逐级之间的区别？

SQL标准定义的四个隔离级别为：

read uncommited :读到未提交数据

read committed ：脏读,不可重复读

repeatable read ：

serializable :串行事物

Read Uncommitted（读取未提交内容）

在该隔离级别，全部事务均可以看到其余未提交事务的执行结果。本隔离级别不多用于实际应用，由于它的性能也不比其余级别好多少。读取未提交的数据，也被称之为脏读（Dirty Read）。

Read Committed（读取提交内容）

这是大多数数据库系统的默认隔离级别（但不是MySQL默认的）。它知足了隔离的简单定义：一个事务只能看见已经提交事务所作的改变。这种隔离级别也支持所谓的不可重复读（Nonrepeatable Read），由于同一事务的其余实例在该实例处理其间可能会有新的commit，因此同一select可能返回不一样结果。

Repeatable Read（可重读）

这是MySQL的默认事务隔离级别，它确保同一事务的多个实例在并发读取数据时，会看到一样的数据行。不过理论上，这会致使另外一个棘手的问题：幻读（Phantom Read）。简单的说，幻读指当用户读取某一范围的数据行时，另外一个事务又在该范围内插入了新行，当用户再读取该范围的数据行时，会发现有新的“幻影” 行。InnoDB和Falcon存储引擎经过多版本并发控制（MVCC，Multiversion Concurrency Control 间隙锁）机制解决了该问题。注：其实多版本只是解决不可重复读问题，而加上间隙锁（也就是它这里所谓的并发控制）才解决了幻读问题。

Serializable（可串行化）

这是最高的隔离级别，它经过强制事务排序，使之不可能相互冲突，从而解决幻读问题。简言之，它是在每一个读的数据行上加上共享锁。在这个级别，可能致使大量的超时现象和锁竞争。

对于不一样的事务，采用不一样的隔离级别分别有不一样的结果。不一样的隔离级别有不一样的现象。主要有下面3种如今：

一、脏读（dirty read）：一个事务能够读取另外一个还没有提交事务的修改数据。

二、非重复读（nonrepeatable read）：在同一个事务中，同一个查询在T1时间读取某一行，在T2时间从新读取这一行时候，这一行的数据已经发生修改，可能被更新了（update），也可能被删除了（delete）。

三、幻像读（phantom read）：在同一事务中，同一查询屡次进行时候，因为其余插入操做（insert）的事务提交，致使每次返回不一样的结果集。

不一样的隔离级别有不一样的现象，并有不一样的锁定/并发机制，隔离级别越高，数据库的并发性就越差，4种事务隔离级别分别表现的现象以下表：

隔离级别	脏读	非重复读	幻像读
read uncommitted	容许	容许	容许
read committed		容许	容许
repeatable read			容许
serializable

13，表中有大字段X（例如：text类型），且字段X不会常常更新，以读为为主，请问

（1）您是选择拆成子表，仍是继续放一块儿？

（2）写出您这样选择的理由？

14，MySQL中InnoDB引擎的行锁是经过加在什么上完成（或称实现）的？为何是这样子的

15 MyISAM 与innodb的区别

1. MySQL中控制内存分配的全局参数，有哪些？（注：至少写6个以上）

1>. Key_buffer_size

2>. innodb_buffer_pool_size

3>. innodb_additional_memory_pool_size

4>. innodb_log_buffer_size

5>. query_cache_size

6>.read_buffer_size

7>.read_rnd_buffer_size

2. 请简洁地描述下MySQL中InnoDB支持的四种事务隔离级别名称，以及逐级之间区别？

Read uncommitted: 在该隔离级别，全部事务均可以看到其余未提交的事务的执行结果。读取未提交的事务，称之为“脏读”。

Read Committed：一个事务只能看见已经提交事务所作的改变。由于同一事务的其余实例在该实例处理其间可能会有新的commit，因此同一select可能返回不一样结果。

Repeatable Read：这是MySQL的默认事务隔离级别，它确保同一事务的多个实例在并发读取数据时，会看到一样的数据行。这种级别会出现幻读。

Serializable：这是最高的隔离级别，它经过强制事务排序，使之不可能相互冲突，从而解决幻读问题

它们之间的区别以下表：

隔离级别	脏读	非重复读	幻像读
Read uncommitted	容许	容许	容许
Read Committed		容许	容许
Repeatable Read			容许
Serializable

3. 小题集锦

1>.VARCHAR(N) 或 CHAR(N)中的N含义是：

N的含义表示N个字节。前者是变长，N的范围是 0~65535，后者是固定长度，N的范围是0~255。

2>.若一张表中只有一个字段VARCHAR(N)类型，utf8编码，则N最大值为多少(精确到数量级便可)：

因为utf8的每一个字符最多占用3个字节。而MySQL定义行的长度不能超过65535，所以N的最大值计算方法为：(65535-1-2)/3。减去1的缘由是实际存储从第二个字节开始，减去2的缘由是由于要在列表长度存储实际的字符长度，除以3是由于utf8限制：每一个字符最多占用3个字节。

所以N=(Floor(65535-1-2)/3)

3>.表中有大字段X（例如：text类型），且字段X不会常常更新，以读为为主，请问您

是选择拆成子表，仍是继续放一块儿，而且写出您的理由？

答案：拆成子表

理由：能够提升其余字段查询和更新的效率，由于每页保存的行数越多，效率会越高。大字段X更新率低，单行读取时效率影响不大。但若是读取的行数越多，影响会越大。所以选择拆成子表更好。

4>.MySQL中InnoDB引擎的行锁是经过加在什么上完成（或称实现）的：

A. 数据块

B. 索引值

选择答案后，告诉咱们为何？

答：B。innodb表数据是索引组织表形式存放

5>.username字段定义为VARCHAR(40)和VARCHAR(200)有啥区别？

答：临时表varchar(200)占用空间更大

5>.MySQL数据库备份方式有那几种（只讨论InnoDB存储引擎），至少写四种。

1>.热备份

2>.冷备份

3>.温备份

4>.二进制日志备份

4. MySQL复制搭建M->N的过程，请简述各个步骤？(备注：M已经在线跑，N为新安装的MySQL服务器)

1> .在启动主从服务器时，必须用server_id启动选项给出其ID值。主从服务器的ID值不能相同。主服务器启动二进制日志。

2>.在主服务器上，建立一个帐户供从服务器链接主服务器并请求修改信息。

3>.链接到主服务器并经过执行showmaster status 语句肯定当前的复制坐标。

4>.在从服务器上为将被复制的数据库创建一份完备的副本。

5>.链接到从服务器并使用changemaster 语句来配置它，包括把用来链接主服务器的参数和初始化复制坐标告诉从服务器。

6>.从服务器开始复制。

5. 看图分析（申明：应用程序未有任何版本变动）

1>.图出现什么样的现象，及现象之间的关联性？

图一表示当前处于锁等待的事务数从07:30到09：30急剧增长。图二表示当前等待写入到磁盘的数据量在19:00到01：00之间很是多，并在22：00达到峰值。

之间的联系：图二是因，图一是果。

2>.经过图信息分析得出可能什么缘由形成的？

服务器宕机

3>.分析出缘由后，告知如何解决？

答：宕机的缘由太多。要查看数据库日志文件和操做系统日志来具体分析。

4>.请简述你是如何思考分析的？

答：两幅图的之间的关系要从时间轴来分析，考虑来龙去脉。

6. SQL语句优化

原SQL语句：

SELECTID,WAYBILL_NO,EXP_TYPE,PKG_QTY,EXPRESS_CONTENT_CODE,EFFECTIVE_TYPE_CODE

FROM T_EXP_OP WHERE ORDERID NOT IN(SELECTORDERID FROM T_EXP_OP WHERE AUX_OP_CODE IN ('NEW','UPDATE','DELETE') AND((OP_CODE IN (176, 162, 171, 131, 136)AND EXP_TYPE IN ('10', '20', '30')) OR(OP_CODE IN (191, 121)AND EXP_TYPE IN ('10', '20')) OR (OP_CODE IN (181,111)AND EXP_TYPE = '10'))) LIMIT 10;

条件：

T_EXP_OP表主键为BIGINT类型的ID字段，存储引擎为InnoDB，无其余索引

优化后为（提示：优化成一条简单的SQL语句，即无子查询，无JOIN关联）：

SELECT ID, WAYBILL_NO, EXP_TYPE, PKG_QTY,EXPRESS_CONTENT_CODE, EFFECTIVE_TYPE_CODE

FROM T_EXP_OP

WHERE

AUX_OP_CODENOT IN (‘NEW’, ‘UPDATE’, ‘DELETE’)

AND(OP_CODE NOT IN (176, 162, 171, 131, 136, 191, 121, 181,111)

ANDEXP_TYPE NOT IN(‘10’, ‘20’, ‘30’))

LIMIT 10;

7. 分页SQL语句优化

原SQL语句：

SELECT * FROM test FORCE(idx_m_n) WHEREm=1 ORDER BY n LIMIT 1000,10;

条件：

Test表为InnoDB存储引擎，主键为BIGINT类型的ID字段，二级索引：idx_m_n(m,n)

优化后为：

索引要修改成: idx_m_n(m,n,ID);

SELECT a.* FROM test a

inner join

(SELECT ID FROM test FORCE(idx_m_n) WHEREm=1 ORDER BY n LIMIT 1000,10 ) b

on a.id=b.id

请简述优化的理由：

1>.二级索引中没有ID字段，没法达到最优化

2>.采用多表链接，效率会更高

3>.

8. 语句挑错

SQL语句：

SELECTM.columnname……,N.* columnname…..

FROMleft_table M LEFT JOIN right_tableN

ON M.columnname_join=N. columnname_join ANDN. columnname=XXX AND M.columnname=XXX

请问本SQL语句哪里不合理，为啥不合理？

答：N.* columnname….. 应该改成N.columnname……

空格符有明显错误，如：M. columnname_join应改成：M.columnname_join，N.columnname_join, N. columnname同理。

9. [SELECT *] 和[SELECT 所有字段]的2种写法有何优缺点，至少写出四点

1>.前者要解析数据字典，后者不须要

2>.结果输出顺序，前者与建表列顺序相同，后者按指定字段顺序。

3>.表字段更名，前者不须要修改，后者须要改

4>.后者能够创建索引进行优化，前者没法优化

5>.后者的可读性比前者要高

10. HAVNG 子句和 WHERE的异同点，至少写出3点

1>.语法上：where 用表中列名，having用select结果别名

2>.影响结果范围：where从表读出数据的行数，having返回客户端的行数

3>.索引：where 可使用索引，having不能使用索引，只能在临时结果集操做

4>.where后面不能使用汇集函数，having是专门使用汇集函数的。

11. 分布式数据库产品的特色（至少写4条）

1>.数据分布在多个异地点，抗灾性强

2>.并发性高

3>.受网络影响很大

4>.单机的性能不是特别重要，可是整体成本很高。

5>.扩展性强

12. 数据拆分架构的优缺点（至少写8条）

1>.透明性，程序不须要作任何修改

2>.解决集中数据库的扩展局限性。实现水平扩展问题，涉及到数据的拆分问题

3>.提升数据库服务的性能、可靠性、可用性

4>.实现技术不难，开发成本和维护成本可控

5>.测试成本高

6>.没法支持分布式事务

7>.数据拆分后数据合并难

8>.部分功能限制

9>.扩展受限