数据库范式

时间 2019-11-17

标签数据库范式栏目 SQL 繁體版

原文原文链接

范式简介

　　设计关系数据库时，听从不一样的规范要求，设计出合理的关系型数据库，这些不一样的规范要求被称为不一样的范式，各类范式呈递次规范，越高的范式数据库冗余越小。

目前关系数据库有六种范式：第一范式（1NF）、第二范式（2NF）、第三范式（3NF）、巴斯-科德范式（BCNF）、第四范式(4NF）和第五范式（5NF，又称完美范式）。知足最低要求的范式是第一范式（1NF）。在第一范式的基础上进一步知足更多规范要求的称为第二范式（2NF），其他范式以次类推。通常说来，数据库只需知足第三范式(3NF）就好了。

各种范式

第一范式（1NF）

所谓第一范式（1NF）是指在关系模型中，对域添加的一个规范要求，全部的域都应该是原子性的，即数据库表的每一列都是不可分割的原子数据项，而不能是集合，数组，记录等非原子数据项。即实体中的某个属性有多个值时，必须拆分为不一样的属性。在符合第一范式（1NF）表中的每一个域值只能是实体的一个属性或一个属性的一部分。简而言之，第一范式就是无重复的域。

说明：在任何一个关系数据库中，第一范式（1NF）是对关系模式的设计基本要求，通常设计中都必须知足第一范式（1NF）。不过有些关系模型中突破了1NF的限制，这种称为非1NF的关系模型。换句话说，是否必须知足1NF的最低要求，主要依赖于所使用的关系模型。

第二范式（2NF）

在1NF的基础上，非码属性必须彻底依赖于候选码（在1NF基础上消除非主属性对主码的部分函数依赖）

第二范式（2NF）是在第一范式（1NF）的基础上创建起来的，即知足第二范式（2NF）必须先知足第一范式（1NF）。第二范式（2NF）要求数据库表中的每一个实例或记录必须能够被惟一地区分。选取一个能区分每一个实体的属性或属性组，做为实体的惟一标识。例如在员工表中的身份证号码便可实现每一个一员工的区分，该身份证号码即为候选键，任何一个候选键均可以被选做主键。在找不到候选键时，可额外增长属性以实现区分，若是在员工关系中，没有对其身份证号进行存储，而姓名可能会在数据库运行的某个时间重复，没法区分出实体时，设计辟如ID等不重复的编号以实现区分，被添加的编号或ID选做主键。（该主键的添加是在ER设计时添加，不是建库时随意添加）

第二范式（2NF）要求实体的属性彻底依赖于主关键字。所谓彻底依赖是指不能存在仅依赖主关键字一部分的属性，若是存在，那么这个属性和主关键字的这一部分应该分离出来造成一个新的实体，新实体与原实体之间是一对多的关系。为实现区分一般须要为表加上一个列，以存储各个实例的惟一标识。简而言之，第二范式就是在第一范式的基础上属性彻底依赖于主键。

第三范式（3NF）

在1NF基础上，任何非主属性不依赖于其它非主属性（在2NF基础上消除传递依赖）

第三范式（3NF）是第二范式（2NF）的一个子集，即知足第三范式（3NF）必须知足第二范式（2NF）。简而言之，第三范式（3NF）要求一个关系中不包含已在其它关系已包含的非主关键字信息。例如，存在一个部门信息表，其中每一个部门有部门编号（dept_id）、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。若是不存在部门信息表，则根据第三范式（3NF）也应该构建它，不然就会有大量的数据冗余。简而言之，第三范式就是属性不依赖于其它非主属性，也就是在知足2NF的基础上，任何非主属性不得传递依赖于主属性。

巴斯-科德范式（BCNF）

Boyce-Codd Normal Form（巴斯-科德范式）

在1NF基础上，任何非主属性不能对主键子集依赖（在3NF基础上消除对主码子集的依赖）

巴斯-科德范式（BCNF）是第三范式（3NF）的一个子集，即知足巴斯-科德范式（BCNF）必须知足第三范式（3NF）。一般状况下，巴斯-科德范式被认为没有新的设计规范加入，只是对第二范式与第三范式中设计规范要求更强，于是被认为是修正第三范式，也就是说，它事实上是对第三范式的修正，使数据库冗余度更小。这也是BCNF不被称为第四范式的缘由。某些书上，根据范式要求的递增性将其称之为第四范式是不规范，也是更让人不容易理解的地方。而真正的第四范式，则是在设计规范中添加了对多值及依赖的要求。

定义：关系模式R<U,F>∈1FNF,若X→Y且Y不是X的子集时X必含有码，则R<U,F>∈BCNF。也就是说，关系模式R<U,F>中，若每个决定因素都包含码，则R<U,F>∈BCNF。

由BCNF的定义能够获得结论，一个知足BCNF的关系模式有：

-全部非主属性对每个码都是彻底函数依赖。

-全部主属性对每个不包含它的码也是彻底函数依赖。

-没有任何属性彻底函数依赖于非码的任何一组属性。

若R∈BCNF，按定义排除了任何属性对码的传递依赖与部分依赖，因此R∈3NF。

通常关系型数据库设计中，达到BCNF就能够了！

范式应用实例

第一范式（1NF）

数据库表中的字段都是单一属性的，不可再分。这个单一属性由基本类型构成，包括整型、实数、字符型、逻辑型、日期型等。在当前的任何关系数据库管理系统（DBMS）中，傻瓜也不可能作出不符合第一范式的数据库，由于这些DBMS不容许你把数据库表的一列再分红二列或多列。所以，你想在现有的DBMS中设计出不符合第一范式的数据库都是不可能的。

首先咱们肯定一下要设计的内容包括那些。学号、学生姓名、年龄、性别、课程名称、课程学分、系别、学科成绩，系办地址、系办电话等信息。为了简单咱们暂时只考虑这些字段信息。咱们对于这些信息，所关心的问题有以下几个方面。

学生有那些基本信息？

学生选了那些课，成绩是什么？

每一个课的学分是多少？

学生属于那个系，系的基本信息是什么？

第二范式（2NF）

首先咱们考虑，把全部这些信息放到一个表中（学号，学生姓名、年龄、性别、课程、课程学分、系别、学科成绩，系办地址、系办电话）下面存在以下的依赖关系。

(学号, 课程名称) → (姓名, 年龄, 成绩, 学分)

问题分析

所以不知足第二范式的要求，会产生以下问题：

数据冗余：同一门课程由n个学生选修，"学分"就重复n-1次；同一个学生选修了m门课程，姓名和年龄就重复了m-1次。

更新异常：

1）若调整了某门课程的学分，数据表中全部行的"学分"值都要更新，不然会出现同一门课程学分不一样的状况。

2）假设要开设一门新的课程，暂时尚未人选修。这样，因为尚未"学号"关键字，课程名称和学分也没法记录入数据库。

删除异常：假设一批学生已经完成课程的选修，这些选修记录就应该从数据库表中删除。可是，与此同时，课程名称和学分信息也被删除了。很显然，这也会致使插入异常。

解决方案

把选课关系表SelectCourse改成以下三个表：

学生：Student（学号，姓名，年龄，性别，系别，系办地址、系办电话）；

课程：Course（课程名称,学分）；

选课关系：SelectCourse（学号，课程名称，成绩）。

第三范式（3NF）

接着看上面的学生表Student（学号，姓名，年龄，性别，系别，系办地址、系办电话），关键字为单一关键字"学号"，由于存在以下决定关系：

（学号）→ （姓名，年龄，性别，系别，系办地址、系办电话

可是还存在下面的决定关系：

（学号） → (系别）→（系办地点，系办电话）

即存在非关键字段"系办地点"、"系办电话"对关键字段"学号"的传递函数依赖。

它也会存在数据冗余、更新异常、插入异常和删除异常的状况。

根据第三范式把学生关系表分为以下两个表就能够知足第三范式了：

学生：（学号，姓名，年龄，性别，系别）；

系别：（系别，系办地址、系办电话）。

上面的数据库表就是符合I，Ⅱ，Ⅲ范式的，消除了数据冗余、更新异常、插入异常和删除异常。

数据库 范式

范式简介

各种范式

第一范式（1NF）

第二范式（2NF）

第三范式（3NF）

巴斯-科德范式（BCNF）

范式应用实例

第一范式（1NF）

第二范式（2NF）

第三范式（3NF）

数据库范式