啥是数据库范式

时间 2021-02-17

标签 sql 数据库 segmentfault 数据库设计性能学习 spa 设计 code orm 栏目 SQL 繁體版

原文原文链接

前言：sql

关于数据库范式，时常有据说过，一直没有详细去了解。通常数据库书籍或数据库课程会介绍范式相关内容，范式也常常出如今数据库考试题目中。不清楚你是否对范式有比较清晰的了解呢？本篇文章咱们一块儿来学习下数据库范式吧。数据库

1.数据库范式简介

为了创建冗余较小、结构合理的数据库，设计数据库时必须遵循必定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库，必须知足必定的范式。segmentfault

范式的英文名称是 Normal Form ，简称 NF 。它是英国人 E.F.Codd 在上个世纪70年代提出关系数据库模型后总结出来的。范式是关系数据库理论的基础，也是咱们在设计数据库结构过程当中所要遵循的规则和指导方法。数据库设计

目前关系型数据库有六种常见范式：第一范式（1NF）、第二范式（2NF）、第三范式（3NF）、巴斯-科德范式（BCNF）、第四范式(4NF）和第五范式（5NF，又称完美范式）。知足最低要求的范式是第一范式（1NF）。在第一范式的基础上进一步知足更多规范要求的称为第二范式（2NF），其他范式以次类推。性能

2.经常使用范式详解

在设计数据库时，会参考范式要求来作，可是并非说遵循的范式等级越高越好，范式太高虽然具备对数据关系有更好的约束性，可是也会致使表之间的关系更加繁琐，从而致使每次操做的表会变多，数据库性能降低。一般，在关系型数据库设计中，最高也就遵循到 BCNF ，广泛仍是 3NF 。即通常状况下，咱们使用前三个范式已经够用了。下面咱们来详细了解下经常使用的前三个范式。学习

第一范式（1NF）spa

第一范式是最基本的范式。若是数据库表中的全部字段值都是不可分解的原子值，就说明该数据库表知足了第一范式。简单的讲第一范式就是每一行的各个数据都是不可分割的，同一列中不能有多个值，若是出现重复的属性就须要定义一个新的实体。设计

示例：假设一家公司要存储其员工的姓名和联系方式。它建立一个以下表：code

两名员工（Jon＆Lester）拥有两个手机号码，所以公司将他们存储在同一表格中，如上表所示。那么该表不符合 1NF ，由于规则说“表的每一个属性必须具备原子（单个）值”，Jon＆Lester员工的 emp_mobile 值违反了该规则。为了使表符合 1NF ，咱们应该有以下表数据：orm

第二范式（2NF）

第二范式在第一范式的基础之上更进一层。第二范式须要确保数据库表中的每一列都和主键相关，而不能只与主键的某一部分相关（主要针对联合主键而言）。也就是说在一个数据库表中，一个表中只能保存一种数据，不能够把多种数据保存在同一张数据库表中。

+----------+-------------+-------+
| employee | department  | head  |
+----------+-------------+-------+
| Jones    | Accountint  | Jones |
| Smith    | Engineering | Smith |
| Brown    | Accounting  | Jones |
| Green    | Engineering | Smith |
+----------+-------------+-------+

上表描述了被雇佣者，工做部门和领导的关系。咱们把可以惟一表示数据库中表的一行的数据成为这个表的主键。表中 head 列不和主键相关。所以，该表是不符合第二范式的，为了使上面的表符合第二范式，须要将它拆分为两个表：

-- employee 为主键
+----------+-------------+
| employee | department  |
+----------+-------------+
| Brown    | Accounting  |
| Green    | Engineering |
| Jones    | Accounting  |
| Smith    | Engineering |
+----------+-------------+

-- department 为主键
+-------------+-------+
| department  | head  |
+-------------+-------+
| Accounting  | Jones |
| Engineering | Smith |
+-------------+-------+

第三范式（3NF）

知足 2NF 的前提下，非主键外的全部字段必须互不依赖，即须要确保数据表中的每一列数据都和主键直接相关，而不能间接相关。

简而言之，第三范式（3NF）要求一个关系中不包含已在其它关系已包含的非主关键字信息。例如，存在一个部门信息表，其中每一个部门有部门编号（dept_id）、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。若是不存在部门信息表，则根据第三范式（3NF）也应该构建它，不然就会有大量的数据冗余。

3.关于反范式

范式的优势是明显的，它避免了大量的数据冗余，节省了存储空间，保持了数据的一致性。范式化的表一般更小，能够更好地放在内存里，因此执行操做会更快。那么是否是只要把全部的表都规范为 3NF 后，数据库的设计就是最优的呢？这可不必定。范式越高意味着表的划分更细，一个数据库中须要的表也就越多，用户不得不将本来相关联的数据分摊到多个表中。稍微复杂一些的查询语句在符合范式的数据库上均可能须要至少一次关联，也许更多，这不但代价昂贵，也可能使一些索引策略无效。

因此咱们在进行数据库设计时，并不会彻底按照范式要求来作，有时候也会进行反范式设计。经过增长冗余或重复的数据来提升数据库的读性能，减小关联查询时，join 表的次数。

参考：