【学习笔记】数据库设计那些事

时间 2019-11-11

原文原文链接

第一章：需求分析

1-1 数据库设计简介

什么是数据库设计？
简单来讲，数据库设计就是根据业务系统的具体须要，结合咱们所选用的数据库管理系统，为这个系统构造出最优的数据存储模型。并创建好数据库中的表结构及表与表之间的关联关系的过程。使之能有效的对应用系统中的数据进行存储，并能够高效对已经存储的数据进行访问。
经常使用的有关系型数据库有：mysql、sqlserver、oracle、pgsql
nosql：redis、mangodb、等等mysql

为何要进行数据库设计？
数据存储，高效访问redis

优良的设计：
减小数据冗余、避免数据维护异常、节约存储空间、高效访问sql

糟糕的设计：
存在大量冗余、存在数据插入、更新、删除异常、浪费大量存储空间、访问数据低效数据库

1-2 数据库设计的步骤

为何要进行数据库设计？
需求分析 - 逻辑设计 - 物理设计 - 维护优化oracle

数据库需求的做用点：nosql

数据是什么？
数据有哪些属性
数据和属性各自的特色有哪些？

逻辑设计：
使用er图对数据库进行逻辑建模数据库设计

物理设计：
根据数据库的自身特色将逻辑模型转换为物理模型函数

维护优化：工具

新的需求进行建表（接到新的需求的时候，也要参照这些流程）
索引优化
大表拆分

1-3 需求分析的重要性简介

为何要进行需求分析？
1. 了解系统中所要存储的数据
2. 了解数据的存储特色：时效性，不具备时效性（过时、清理、归档）
3. 了解数据的生命周期：快，数据量很大，但不是核心数据
4. 日志不适合存在数据库中。可是必定要存的话，要提早定义好清理和归档规则。随着上线进行归档和清理。sqlserver

需求分析最好是在头脑风暴中进行碰撞而后肯定下来的东西。

需求分析主要讨论目标

了解系统中全部存储的数据
1. 实体及实体之间的关系（1对1，1对多，多对多）
2. 实体所包含的属性有什么？
3. 哪些属性和属性的组合能够惟一标识一个实体
了解数据的存储特色
了解数据的生命周期

第二章逻辑设计

2-1 ER图

将需求转换为数据库的逻辑模型
经过ER图的形式对逻辑模型进行展现
通所选用的数据库不要紧
名词解释：
关系：一个关系对应一般所说的一张表
元组：表中的一行即为一个元组
属性：一列就是一个属性
候选码：表中的某个属性组
主码：一个关系中有多个候选码，选定其中一个作为主码
域: 属性的取值范围【男，女】
份量：元组中的一个属性值，男和女
矩形：表示实体集，矩形内写实体集的名字
菱形：表示联系集（将原先多对多的关系，转换为一对多的关系）
椭圆：表示实体的属性，加下标的就是主键
线段：将属性链接到实体集，或将实体集链接到联系集

2-2 设计范式概要

操做异常：
插入异常：若是实体随着另外一个实体的存在而存在，既缺乏某个实体时没法表示这个实体，这个表就存在插入异常
更新异常：若是更改表所对应的某个实体实例的单独属性时，须要将多行进行更新，那么久说这个表存在更新异常
删除异常：若是删除表的某一行来反映实例失效时致使拎一个不一样实例信息丢失，那么这个表中就存在删除异常
数据冗余：相同的数据在多个地方存在，或者说表中的某个列可以由其余列计算获得，这样就存在数据冗余
数据库设计通常遵循的范式：第一范式、第二范式、第三范式、Dc范式、反范式设计、第四范式和第五范式通常不涉及。
插入异常、删除异常、更新异常、数据冗余（通常设计，是在反范式设计中为了提升性能，以及查询的方便程度来确认的）
通常互联网应用查询和更新的比例是4笔1或者3比1

2-3 第一范式

全部字段都是单一属性，不可再分，这个单一属性是由基本的数据类型所构成的

2-4 第二范式

定义：数据库中表不存在非关键字对于候选关键字的部分函数依赖
对于单主键必定符合第二范式

2-5 第三范式

不存在非关键字段对任意候选字段的传递函数依赖则符合第三范式
第一第二第三范式都是实体设计不合理，冗余数据，传递主键依赖，致使插入修改删除的异常。

2-6 BC范式

表中若是不存在任何字段对任一候选关键字段的传递函数依赖，则符合bc范式。
候选关键字的传递函数依赖。a 决定b b 决定a 可是都是候选关键字。
设计的时候最好都是单关键字的表，组合主键的最好少创建。

第三章物理设计

3-1 数据库物理设计要作什么

选择合适的数据库管理系统
定义数据库、表及字段命名规范（按照数据库定义）
对所选的dbms系统选择合适的字段类型：字段类型
反范式化的设计，以空间换时间

3-2 选择哪一种数据库

oracle（适合大的事务操做）
sqlserver（操做系统）开发语言使用的语言.net
mysql应用的场景
pgsql

3-3 MYSQL经常使用存储引擎

通常如今都是默认innodb，支持事务、行级表锁定，ndb cluster（是内存形式的，通常都不用）
archive使用场景适合日志

3-4 数据库表及字段类型选择原则

表及字段的命名规范：

可读性原则，使用大小写来格式化数据库名来得到良好的可读性
表意性原则
长名性原则

3-5 数据库字段类型选择原则

生日：char、varchar、日期时间、Int时间戳
字段选择原则：优先选择数字类型、再次选择date类型、其次是char、最后才是varchar

以上选择原则：

对数据进行比较（查询条件、join条件以及排序）操做时候：一样的数据字符处理每每比数字处理慢。
数据库中数据处理以页为单位，列的长度越小，利于性能提高，io性能提升。数据库最大是磁盘io的瓶颈

3-6 数据库如何具体选字段类型

同类型：占用空间小的。整形优先
char仍是varchar来存储？

若是列中药存储的数据长度是差很少一致的，应该考虑使用char
若是列中最大数据长度小于50byte，则通常也考虑使用char
通常不定义大于50byte的char类型列（不一样类型的占用是不相同的，utf8是三个字节的）

decimal与float如何选择

decimal用于存储精确数据，而float只能存储非精确数据。故精确数据只能选择decimal类型
因为float存储空间开销通常比decimal小，精确到7位小数只须要4个字节，15为须要8个字节。故非精确数据优先选择float类型

时间类型如何存储

使用int来存储时间字段（常常用的话仍是使用date类型来存储）
优势：字段小
缺点：使用不方便，要进行函数转换
限制：只能存储到2038-1-19
须要存储时间粒度问题

3-7 数据库设计其余注意事项

如何选择主键

区分业务主键和数据库主键
业务主键用于标识业务数据，进行表与表之间的关联
数据库主键为了优化数据存储，生成6字节的隐含主键
根据数据库的类型，考虑主键是否要顺序增加
主键的字段类型所占用的空间要近可能的小（io性能）
避免使用外键约束
下降数据导入的效率
增长维护成本
虽然不建议使用外键约束，可是相关联的列上必定要创建索引。
避免使用触发器
下降数据导入的效率
可能出现意想不到的数据异常
是业务逻辑变复杂
关于预留字段
没法知道预留字段的类型
没法准确知道预留字段中所存储的内容
后期维护预留字段所要的成本通增长一个字段所需的成本是相同的
禁止使用预留字段

3-8 反范式化表设计

为了性能和读取效率对于第三范式进行违反，容许少许的数据冗余，提升读取效率。换句话说就是以空间换时间。

减小表关联的数量
增长数据的读取效率
反范式化必定要适度（是可控的）

第4章维护优化

4-1 数据库维护和优化要作什么

维护数据字段
维护索引
维护表结构
在适当的时候对表进行水平拆分和垂直拆分

4-2 数据库如何维护数据字典

使用第三方工具对于数据字典进行维护
使用数据库自己的备注字段来维护数据字典
导出数据字典，使用mysql内置表的形式

4-3 数据库如何维护索引

如何维护索引

出如今where从句，group by从句、orderby 从句
选择可选择性高的列要放到索引的前面
索引中不要包括太长的数据类型，对于前面部分的进行索引，因此禁止全关联查询
注意事项：
索引并非越多越好、过多的索引不但会下降写的效率（维护效率），还会下降读的效率（选择效率）。
按期维护索引碎片
sql语句中不要使用强制索引关键字

4-4 数据库中适合的操做

表结构维护：

使用在线变动表结构工具
同时对数据字典进行维护
控制表的宽度和大小
数据库中适合的操做
批量操做（sql） vs 逐条操做（存储过程）
禁止使用select * 这样的函数查询
控制使用用户自定义函数，对索引的时候产生影响
不要使用数据库中的全文索引（须要另外创建全文索引，若是必要最好使用搜索引擎）

4-5 数据库表的垂直和水平拆分

为了控制表的宽度，能够进行表的垂直拆分：大表拆分小表（数据量是没有变化的）

常常查询的列放到一块儿
text，blob等大字段拆分出到附加表中（优化io效率）
为了控制表的大小能够进行表的水平拆分：
经过主键hash的方式进行水平拆分，将五张表成为一张大表（优化表io）
分库
一个数据库已经没有办法将数据所有容纳下的时候，就须要使用。

数据库表设计要求

必需要有的字段：1. Id、2. 建立时间、3. 修改时间、4. 版本号、5. 逻辑删除标记

乐观锁：

对更新比较信任，通常不会出现同时更新的状况
同时读取到旧数据，同时对于数据进行更新

悲观锁：

对更新不信任，在进行更新的时候，会将表数据锁住，不容许读取，等到更新完毕后，在放开当前的锁。
可以保证在更新的时候，系统数据都是正确的。
要求改前将数据锁住，别人都不可以读取，将数据进行修改，提交后释放锁，别人才可以读取。

数据库设计那些事