后端数据库攻略

时间 2020-01-09

标签后端数据库攻略栏目 SQL 繁體版

原文原文链接

(一)MySQL基础考点

1.事务的原理特性及并发控制

什么是事务(Transaction)？

事务是数据库并发控制的基本单位
事务能够看做是一些列SQL语句的集合
事务必需要么所有执行成功，要么所有执行失败(回滚)
事务使用常见的场景:银行转帐操做

事务的ACID特性

原子性(Atomicity)：一个事务中全部操做所有完成或失败
一致性(Consistency)：事务开始和结束以后数据完整性没有被破坏
隔离性(Isolation)：容许多个事务同时对数据库修改和读写
持久性(Durability)：事务结束以后，修改是永久的不会被丢失

事务并发控制

可能产生哪些问题？

幻读：一个事务第二次查出现第一次没有的结果
非重复读：一个事务重复读两次获得不一样的结果
脏读：一个事务读取到另外一个事务没有提交的修改
丢失修改：并发写入形成其中一些修改丢失

解决并发异常，定义4种事务隔离级别

读未提交：别的事务能够读取到未提交改变
读已提交：只能读取已经提交的数据
可重复读：同一个事务前后查询结果同样(Mysql innoDB默认实现可重复读级别)
串行化： 事务彻底串行化执行，隔离级别最高，效率最低

如何解决高并发场景下的插入重复(写入数据库会出现重复问题)

使用数据库的惟一索引
使用队列异步写入
使用redis等实现分布式锁

乐观锁和悲观锁

悲观锁：先获取锁再进行操做。一锁二查三更新 select for update
乐观锁：先修改，更近的时候发现数据已经变了就回滚(check and set)
使用须要根据响应速度、冲突频率、重试代价来判断使用哪种

2.常见字段的含义及区别

文本型

CHAR
VARCHAR
TINYTEXT
TEXT

数值型

TINYINT
SMALLINT
INT
SIGINT
FLOAT
DOUBLE

日期和时间

DATE
DATETIME
TIMESTAMP (4个字节，但接受的时间1970-2038年之间)

3.常见数据库引擎之间的区别(InnoDB VS MyISAM)

MyISAM不支持事务，InnoDB支持事务
MyISAM不支持外键，InnoDB支持外键
MyISAM只支持表锁，InnoDB支持行锁和表锁
MyISAM支持全文索引，InnoDB不支持

(二)Mysql索引原理及优化常见考题

1. 索引的原理、类型、结构

什么是索引？

数据表种一个或者多个列进行排序的数据结构
索引可以大幅提高索引速度
建立、更新索引自己也会消耗空间和时间

什么是B-Tree？(查找结构进化史)

多路平衡查找树

B+Tree

Mysql实际使用的B+Tree做为索引的数据结构

2. 建立索引的注意事项，使用原理

常见索引类型

普通索引  CREATE INDEX
惟一索引，索引列的值必须惟一 CREATE UNIQUE INDEX
多列索引(联合索引)
主键索引 一个表只能有一个  PRIMARY KEY
全文索引 InnoDB不支持(通常采用专门的全文索引数据库实现)

何时建立索引？(建表的时候须要根据查询需求来建立索引)

常常用做查询条件的字段(WHERE条件)
常常用做表链接的字段
常常出如今order by, group by以后的字段

建立索引有哪些须要注意的?(最佳实践)

非空字段NOT NULL, Mysql很难对空值作查询优化
区分度高，离散度大，做为索引的字段值尽可能不要有大量相同值
索引的长度不要太大(比较消耗时间--索引做为B+Tree的key值存在,字符串key太长比较耗时)

索引何时失效？

记忆口诀：模型匹配、类型隐转、最左匹配
以%开头的LIKE语句，模糊搜索
出现隐式转换(python这种动态语言查询中须要注意)
没有知足最左前缀原理(针对联合索引)

什么汇集索引和非汇集索引

是指B+Tree叶节点存的是指针仍是数据记录
MyISAM索引和数据分离，使用的是非汇集索引(存的是数据指针)
InnoDB数据文件就是索引文件，主键索引就是汇集索引

3.如何排查和消除慢查询

慢查询一般是缺乏索引，索引不合理或者业务代码实现致使

排查

slow_query_log_file开启而且查询慢查询日志
经过explain命令排查索引问题
调整数据修改索引；业务代码层限制不合理访问(好比一次获取太多数据--实现分页; 数据类型不匹配致使全文扫描)

(三)SQL语句编写常考题

1.经常使用链接为重点

内链接(INNER JOIN):两个表都存在匹配时，才会返回匹配行
外链接(LEFT/RIGHT JOIN)： 返回一个表的行，即便另外一个没有匹配
全链接(FULL JOIN)：只要某一个表存在匹配就返回

(四)非关系型数据库Redis

1. 缓存(内存缓存)的使用场景

为何要使用缓存？

缓解关系数据(常见的Mysql)并发访问的压力: 热点数据
减小响应时间：内存IO速度比磁盘快
提高吞吐量： Redis等内存数据库单机就能够支持很大并发

Redis和Memcached主要区别？

数据存储类型：redis支持string/List/hash/set/sort set；memcached只支持文本型/二进制类型
网络IO模型：redis单进程模式；memcached多线程、非阻塞IO模式
持久化支持：redis支持两种RDB,DOF; memcached不支持

2. Redis经常使用数据类型和使用场景？

数据类型

String(字符串)：用来实现简单的KV键值对存储，好比计数器
List(链表): 实现双向链表，好比用户的关注，粉丝列表
Hash(哈希表)：用来存储彼此相关信息的键值对
Set(集合)：存储不重复元素，好比用户的关注者
Sorted set(有序集合)：实时信息排行榜python

支持两种方式实现持久化

快照方式：把树快照放在磁盘二进制文件中，dump.rdb
AOF: 每个写命令追加到appendonly.aof中
能够修改经过Redis配置实现

什么redis事务？

将多个请求打包，一次性，按序执行多个命令的机制
经过 MULTI, EXEC,WATCH等命令实现事务功能

如何实现分布式锁？

使用setnx实现加锁，能够同时经过expire添加超时时间
锁的value值可使用一个随机的uuid或者特定的命名
释放锁的时候，经过uuid判断是不是该锁，是则执行delete释放锁

3. 缓存使用的坑

使用缓存的模式？

Cache Aside:  同时更新缓存和数据库
Read/Write Through: 先更新缓存，缓存负责同步更新数据库
Write Behind Caching: 先更新缓存，缓存按期异步更新数据库

如何解决缓存穿透问题？

缘由：因为大量缓存查不到就去数据库取，数据库也没有要查的数据
解决：对于没有查到返回None的数据也缓存; 插入数据的时候删除相应缓存，或者设置较短的超时时间

如何解决缓存击穿问题？

缘由：某些很是热点的数据key过时，大量请求达到后端数据库
解决：
    分布式锁-获取锁的线程从数据库拉数据更新缓存，其余线程等待
    异步后台更新-后台任务针对过时key自动刷新

如何解决缓存雪崩问题？

缘由：缓存不可用或大量缓存key同时失效，大量请求直接达到数据库
解决：
    多级缓存--不一样级别的key设置不一样的超时时间
    随机超时--key的超时时间随机设置，防止同时超时
    架构层--提高系统可用性，监控、报警完善

(五)Mysql与Redis练习题

1. Mysql思考题

为何Mysql数据库主键使用自增的整数比较好？uuid能够吗？

在最佳实践中，auto_increment字段长度比uuid小，从性能及可读性都比uuid要好

若是是分布式系统下咱们怎么生成数据库的自增id呢？

在auto_increment的基础上，设置step增加步长；好比：Master1 生成的是 1，4，7，10，
    Master2生成的是2,5,8,11 Master3生成的是 3,6,9,12。
    这样就能够有效生成集群中的惟一ID，也能够大大下降ID生成数据库操做的负载。

2. Redis应用-分布式锁

编写一个简单的分布式锁，要求支持超时时间参数

import time
import redis

class RedisLock(object):
    def __init__(self, key, timeout):
        self.rdcon = redis.Redis(host='', port=6379, password="", db=1)
        self._lock = 0
        self.timeout = timeout
        self.lock_key = "%s_dynamic_test" % key

    @staticmethod
    def get_lock(cls):
        while cls._lock != 1:
            timestamp = time.time() + self.timeout + 1
            cls._lock = cls.rdcon.setnx(cls.lock_key, timestamp)
　　　　　　　# 注意下方括号的范围
            if cls._lock == 1 or (time.time() > cls.rdcon.get(cls.lock_key) and time.time() > cls.rdcon.getset(cls.lock_key, timestamp)):
                print "get lock"
                break
            else:
                time.sleep(0.3)

    @staticmethod
    def release(cls):
        if time.time() < cls.rdcon.get(cls.lock_key):
            print("release lock")
            cls.rdcon.delete(cls.lock_key)

def deco(cls):
    def _deco(func):
        def __deco(*args, **kwargs):
            print("before %s called [%s]."%(func.__name__, cls))
            cls.get_lock(cls, timeout)
            try:
                return func(*args, **kwargs)
            finally:
                cls.release(cls)
        return __deco
    return _deco

@deco(RedisLock("key"))
def myfunc():
    # do_something
    time.sleep(20)


if __name__ == "__main__":
    myfunc()

后端数据库攻略

(一)MySQL基础考点

1.事务的原理 特性及并发控制

什么是事务(Transaction)？

事务的ACID特性

事务并发控制

可能产生哪些问题？

解决并发异常，定义4种事务隔离级别

如何解决高并发场景下的插入重复(写入数据库会出现重复问题)

乐观锁和悲观锁

2.常见字段的含义及区别

文本型

数值型

日期和时间

3.常见数据库引擎之间的区别(InnoDB VS MyISAM)

(二)Mysql索引原理及优化常见考题

1. 索引的原理、类型、结构

什么是索引？

什么是B-Tree？(查找结构进化史)

B+Tree

2. 建立索引的注意事项，使用原理

常见索引类型

何时建立索引？(建表的时候须要根据查询需求来建立索引)

建立索引有哪些须要注意的?(最佳实践)

索引何时失效？

什么汇集索引和非汇集索引

3.如何排查和消除慢查询

慢查询一般是缺乏索引，索引不合理或者业务代码实现致使

排查

(三)SQL语句编写常考题

1.经常使用链接为重点

(四)非关系型数据库Redis

1. 缓存(内存缓存)的使用场景

为何要使用缓存？

Redis和Memcached主要区别？

2. Redis经常使用数据类型和使用场景？

数据类型

支持两种方式实现持久化

什么redis事务？

如何实现分布式锁？

3. 缓存使用的坑

使用缓存的模式？

如何解决缓存穿透问题？

如何解决缓存击穿问题？

如何解决缓存雪崩问题？

(五)Mysql与Redis练习题

1. Mysql思考题

为何Mysql数据库主键使用自增的整数比较好？uuid能够吗？

若是是分布式系统下咱们怎么生成数据库的自增id呢？

2. Redis应用-分布式锁

1.事务的原理特性及并发控制