一、MySQL的复制原理以及流程前端
基本原理流程,3个线程以及之间的关联;mysql
主:binlog线程——记录下全部改变了数据库数据的语句,放进master上的binlog中;sql
从:io线程——在使用start slave 以后,负责从master上拉取 binlog 内容,放进 本身的relay log中;数据库
从:sql执行线程——执行relay log中的语句;缓存
二、MySQL中myisam与innodb的区别,至少5点安全
(1)、问5点不一样;服务器
(2)、innodb引擎的4大特性网络
插入缓冲(insert buffer),二次写(double write),自适应哈希索引(ahi),预读(read ahead)数据结构
(3)、2者selectcount(*)哪一个更快,为何多线程
myisam更快,由于myisam内部维护了一个计数器,能够直接调取。
三、MySQL中varchar与char的区别以及varchar(50)中的50表明的涵义
(1)、varchar与char的区别
char是一种固定长度的类型,varchar则是一种可变长度的类型
(2)、varchar(50)中50的涵义
最多存放50个字符,varchar(50)和(200)存储hello所占空间同样,但后者在排序时会消耗更多内存,由于order by col采用fixed_length计算col长度(memory引擎也同样)
(3)、int(20)中20的涵义
是指显示字符的长度
但要加参数的,最大为255,好比它是记录行数的id,插入10笔资料,它就显示00000000001 ~~~00000000010,当字符的位数超过11,它也只显示11位,若是你没有加那个让它未满11位就前面加0的参数,它不会在前面加0
20表示最大显示宽度为20,但仍占4字节存储,存储范围不变;
(4)、mysql为何这么设计
对大多数应用没有意义,只是规定一些工具用来显示字符的个数;int(1)和int(20)存储和计算均同样;
四、问了innodb的事务与日志的实现方式
(1)、有多少种日志;
错误日志:记录出错信息,也记录一些警告信息或者正确的信息。
查询日志:记录全部对数据库请求的信息,不论这些请求是否获得了正确的执行。
慢查询日志:设置一个阈值,将运行时间超过该值的全部SQL语句都记录到慢查询的日志文件中。
二进制日志:记录对数据库执行更改的全部操做。
中继日志:中继日志也是二进制日志,用来给slave 库恢复
事务日志:重作日志redo和回滚日志undo
(2)、事物的4种隔离级别
隔离级别
(3)、事务是如何经过日志来实现的,说得越深刻越好。
事务日志是经过redo和innodb的存储引擎日志缓冲(Innodb log buffer)来实现的,当开始一个事务的时候,会记录该事务的lsn(log sequence number)号; 当事务执行时,会往InnoDB存储引擎的日志的日志缓存里面插入事务日志;当事务提交时,必须将存储引擎的日志缓冲写入磁盘(经过innodb_flush_log_at_trx_commit来控制),也就是写数据前,须要先写日志。这种方式称为“预写日志方式”
五、MySQL binlog的几种日志录入格式以及区别
Statement:每一条会修改数据的sql都会记录在binlog中。
优势:不须要记录每一行的变化,减小了binlog日志量,节约了IO,提升性能。(相比row能节约多少性能 与日志量,这个取决于应用的SQL状况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,可是考虑到若是带条 件的update操做,以及整表删除,alter表等操做,ROW格式会产生大量日志,所以在考虑是否使用ROW格式日志时应该跟据应用的实际状况,其所 产生的日志量会增长多少,以及带来的IO性能问题。)
缺点:因为记录的只是执行语句,为了这些语句能在slave上正确运行,所以还必须记录每条语句在执行的时候的 一些相关信息,以保证全部语句能在slave获得和在master端执行时候相同 的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有不少相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).
使用如下函数的语句也没法被复制:
同时在INSERT …SELECT 会产生比 RBR 更多的行级锁
Row:不记录sql语句上下文相关信息,仅保存哪条记录被修改。
优势: binlog中能够不记录执行的sql语句的上下文相关的信息,仅须要记录那一条记录被修改为什么了。因此rowlevel的日志内容会很是清楚的记录下 每一行数据修改的细节。并且不会出现某些特定状况下的存储过程,或function,以及trigger的调用和触发没法被正确复制的问题
缺点:全部的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比 如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样形成binlog日志量会很大,特别是当执行alter table之类的语句的时候,因为表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。
Mixedlevel: 是以上两种level的混合使用,通常的语句修改使用statment格式保存binlog,如一些函数,statement没法完成主从复制的操做,则 采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择 一种.新版本的MySQL中队row level模式也被作了优化,并非全部的修改都会以row level来记录,像遇到表结构变动的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,仍是会记录全部行的变动。
六、MySQL数据库cpu飙升到500%的话他怎么处理?
七、sql优化各类方法
(1)、explain出来的各类item的意义;
select_type 复制代码
表示查询中每一个select子句的类型
type 复制代码
表示MySQL在表中找到所需行的方式,又称“访问类型”
possible_keys 复制代码
指出MySQL能使用哪一个索引在表中找到行,查询涉及到的字段上若存在索引,则该索引将被列出,但不必定被查询使用
key 复制代码
显示MySQL在查询中实际使用的索引,若没有使用索引,显示为NULL
key_len 复制代码
表示索引中使用的字节数,可经过该列计算查询中使用的索引的长度
ref 复制代码
表示上述表的链接匹配条件,即哪些列或常量被用于查找索引列上的值
Extra 复制代码
包含不适合在其余列中显示但十分重要的额外信息
(2)、profile的意义以及使用场景;
查询到 SQL 会执行多少时间, 并看出 CPU/Memory 使用量, 执行过程当中 Systemlock, Table lock 花多少时间等等
八、备份计划,mysqldump以及xtranbackup的实现原理
(1)、备份计划;
这里每一个公司都不同,您别说那种1小时1全备什么的就行
(2)、备份恢复时间;
这里跟机器,尤为是硬盘的速率有关系,如下列举几个仅供参考
20G的2分钟(mysqldump)
80G的30分钟(mysqldump)
111G的30分钟(mysqldump)
288G的3小时(xtra)
3T的4小时(xtra)
逻辑导入时间通常是备份时间的5倍以上
(3)、xtrabackup实现原理
在InnoDB内部会维护一个redo日志文件,咱们也能够叫作事务日志文件。事务日志会存储每个InnoDB表数据的记录修改。当InnoDB启动时,InnoDB会检查数据文件和事务日志,并执行两个步骤:它应用(前滚)已经提交的事务日志到数据文件,并将修改过但没有提交的数据进行回滚操做。
九、mysqldump中备份出来的sql,若是我想sql文件中,一行只有一个insert….value()的话,怎么办?若是备份须要带上master的复制点信息怎么办?
--skip-extended-insert [root@helei-zhuanshu ~]# mysqldump -uroot -p helei --skip-extended-insert Enter password: KEY `idx_c1` (`c1`), KEY `idx_c2` (`c2`) ) ENGINE=InnoDB AUTO_INCREMENT=51 DEFAULT CHARSET=latin1; /*!40101 SET character_set_client = @saved_cs_client */; -- -- Dumping data for table `helei` -- LOCK TABLES `helei` WRITE; /*!40000 ALTER TABLE `helei` DISABLE KEYS */; INSERT INTO `helei` VALUES (1,32,37,38,'2016-10-18 06:19:24','susususususususususususu'); INSERT INTO `helei` VALUES (2,37,46,21,'2016-10-18 06:19:24','susususususu'); INSERT INTO `helei` VALUES (3,21,5,14,'2016-10-18 06:19:24','susu'); 复制代码
十、500台db,在最快时间以内重启
可使用批量 ssh 工具 pssh 来对须要重启的机器执行重启命令。 也可使用 salt(前提是客户端有安装 salt)或者 ansible( ansible 只须要 ssh 免登通了就行)等多线程工具同时操做多台服务器
十一、innodb的读写参数优化
(1)、读取参数
global buffer pool以及 local buffer; 复制代码
(2)、写入参数;
innodb_flush_log_at_trx_commit innodb_buffer_pool_size 复制代码
(3)、与IO相关的参数;
innodb_write_io_threads = 8 innodb_read_io_threads = 8 innodb_thread_concurrency = 0 复制代码
(4)、缓存参数以及缓存的适用场景。
query cache/query_cache_type 复制代码
并非全部表都适合使用query cache。形成query cache失效的缘由主要是相应的table发生了变动
第一个:读操做多的话看看比例,简单来讲,若是是用户清单表,或者说是数据比例比较固定,好比说商品列表,是能够打开的,前提是这些库比较集中,数据库中的实务比较小。
第二个:咱们“行骗”的时候,好比说咱们竞标的时候压测,把query cache打开,仍是能收到qps激增的效果,固然前提示前端的链接池什么的都配置同样。大部分状况下若是写入的居多,访问量并很少,那么就不要打开,例如社交网站的,10%的人产生内容,其他的90%都在消费,打开仍是效果很好的,可是你若是是qq消息,或者聊天,那就很要命。
第三个:小网站或者没有高并发的无所谓,高并发下,会看到 不少 qcache 锁 等待,因此通常高并发下,不建议打开query cache
十二、你是如何监控大家的数据库的?大家的慢日志都是怎么查询的?
监控的工具备不少,例如zabbix,lepus,我这里用的是lepus
1三、你是否作过主从一致性校验,若是有,怎么作的,若是没有,你打算怎么作?
主从一致性校验有多种工具 例如checksum、mysqldiff、pt-table-checksum等
1四、大家数据库是否支持emoji表情,若是不支持,如何操做?
若是是utf8字符集的话,须要升级至utf8_mb4方可支持
1五、你是如何维护数据库的数据字典的?
这个你们维护的方法都不一样,我通常是直接在生产库进行注释,利用工具导出成excel方便流通。
1六、表中有大字段X(例如:text类型),且字段X不会常常更新,以读为为主,请问
拆带来的问题:链接消耗 + 存储拆分空间;不拆可能带来的问题:查询性能;
1七、MySQL中InnoDB引擎的行锁是经过加在什么上完成(或称实现)的?为何是这样子的?
InnoDB是基于索引来完成行锁
例: select * from tab_with_index where id = 1 for update;
for update 能够根据条件来完成行锁锁定,而且 id 是有索引键的列,
若是 id 不是索引键那么InnoDB将完成表锁,,并发将无从谈起
1八、开放性问题:听说是腾讯的
一个6亿的表a,一个3亿的表b,经过外间tid关联,你如何最快的查询出知足条件的第50000到第50200中的这200条数据记录。
select * from a,b where a.tid = b.id and a.tid>500000 limit 200; 复制代码
select * from b , (select tid from a limit 50000,200) a where b.id = a .tid; 复制代码
1九、什么是存储过程?有哪些优缺点?
存储过程是一些预编译的SQL语句。
20、索引是什么?有什么做用以及优缺点?
MySQL数据库几个基本的索引类型:普通索引、惟一索引、主键索引、全文索引
2一、什么是事务?
事务(Transaction)是并发控制的基本单位。所谓的事务,它是一个操做序列,这些操做要么都执行,要么都不执行,它是一个不可分割的工做单位。事务是数据库维护数据一致性的单位,在每一个事务结束时,都能保持数据一致性。
2二、使用索引查询必定能提升查询的性能吗?为何
一般,经过索引查询数据比全表扫描要快.可是咱们也必须注意到它的代价.
2三、简单说一说drop、delete与truncate的区
SQL中的drop、delete、truncate都表示删除,可是三者有一些差异
2四、drop、delete与truncate分别在什么场景之下使用?
2五、超键、候选键、主键、外键分别是什么?
2六、什么是视图?以及视图的使用场景有哪些?
2七、说一说三个范式。
2八、数据库的乐观锁和悲观锁是什么?
数据库管理系统(DBMS)中的并发控制的任务是确保在多个事务同时存取数据库中同一数据时不破坏事务的隔离性和统一性以及数据库的统一性。乐观并发控制(乐观锁)和悲观并发控制(悲观锁)是并发控制主要采用的技术手段。
悲观锁:假定会发生并发冲突,屏蔽一切可能违反数据完整性的操做
乐观锁:假设不会发生并发冲突,只在提交操做时检查是否违反数据完整性。
加q群:468897908 可获取一份Java架构进阶学习资源(高并发+Spring源码+JVM原理解析+分布式架构+微服务架构+多线程并发原理等...这些成为架构师必备的内容)以及Java进阶学习路线图。