转自:html
http://blog.chinaunix.net/uid-10073362-id-225057.html数据库
数据库范式是数据库设计中必不可少的知识,没有对范式的理解,就没法设计出高效率、优雅的数据库。甚至设计出错误的数据库。而想要理解并掌握范式却并非那 么容易。教科书中通常以关系代数的方法来解释数据库范式。这样作虽然可以十分准确的表达数据库范式,但比较抽象,不太直观,不便于理解,更难以记忆。
本文用较为直白的语言介绍范式,旨在便于理解和记忆,这样作可能会出现一些不精确的表述。但对于初学者应该是个不错的入门。我写下这些的目的主要是为了增强 记忆,其实我也比较菜,我但愿当我对一些概念生疏的时候,回过头来看看本身写的笔记,能够快速地进入状态。若是你发现其中用错误,请指正。
下面开始进入正题:
1、基础概念
要理解范式,首先必须对知道什么是关系数据库,若是你不知道,我能够简单的不能再简单的说一下:关系数据库就是用二维表来保存数据。表和表之间能够……(省略10W字)。
而后你应该理解如下概念:
数据库设计
2、6个范式
好了,上面已经介绍了咱们掌握范式所须要的所有基础概念,下面咱们就来说范式。首先要明白,范式的包含关系。一个数据库设计若是符合第二范式,必定也符合第一范式。若是符合第三范式,必定也符合第二范式…
第一范式(1NF):属性不可分。
在前面咱们已经介绍了属性值的概念,咱们说,它是“不可分的”。而第一范式要求属性也不可分。那么它和属性值不可分有什么区别呢?给一个例子:
ui
name | tel | age | |
大宝 | 13612345678 | 22 | |
小明 | 13988776655 | 010-1234567 | 21 |
Ps:这个表中,属性值“分”了。
spa
name | tel | age | |
手机 | 座机 | ||
大宝 | 13612345678 | 021-9876543 | 22 |
小明 | 13988776655 | 010-1234567 | 21 |
Ps:这个表中,属性 “分”了。
这两种状况都不知足第一范式。不知足第一范式的数据库,不是关系数据库!因此,咱们在任何关系数据库管理系统中,作不出这样的“表”来。
第二范式(2NF):符合1NF,而且,非主属性彻底依赖于码。
听起来好像很神秘,其实真的没什么。
一 个候选码中的主属性也多是好几个。若是一个主属性,它不能单独作为一个候选码,那么它也不能肯定任何一个非主属性。给一个反例:咱们考虑一个小学的教务 管理系统,学生上课指定一个老师,一本教材,一个教室,一个时间,你们都上课去吧,没有问题。那么数据库怎么设计?(学生上课表)
.net
学生 | 课程 | 老师 | 老师职称 | 教材 | 教室 | 上课时间 |
小明 | 一年级语文(上) | 大宝 | 副教授 | 《小学语文1》 | 101 | 14:30 |
一个学生上一门课,必定在特定某个教室。因此有(学生,课程)->教室
一个学生上一门课,必定是特定某个老师教。因此有(学生,课程)->老师
一个学生上一门课,他老师的职称能够肯定。因此有(学生,课程)->老师职称
一个学生上一门课,必定是特定某个教材。因此有(学生,课程)->教材
一个学生上一门课,必定在特定时间。因此有(学生,课程)->上课时间
所以(学生,课程)是一个码。
然而,一个课程,必定指定了某个教材,一年级语文确定用的是《小学语文1》,那么就有课程->教材。(学生,课程)是个码,课程却决定了教材,这就叫作不彻底依赖,或者说部分依赖。出现这样的状况,就不知足第二范式!
有什么很差吗?你能够想一想:
一、校长要新增长一门课程叫“微积分”,教材是《大学数学》,怎么办?学生还没选课,而学生又是主属性,主属性不能空,课程怎么记录呢,教材记到哪呢? ……郁闷了吧?(插入异常)
二、下学期没学生学一年级语文(上)了,学一年级语文(下)去了,那么表中将不存在一年级语文(上),也就没了《小学语文1》。这时候,校长问:一年级语文(上)用的什么教材啊?……郁闷了吧?(删除异常)
三、校长说:一年级语文(上)换教材,换成《大学语文》。有10000个学生选了这么课,改动好大啊!改累死了……郁闷了吧?(修改异常)
那应该怎么解决呢?投影分解,将一个表分解成两个或若干个表
设计
学生 | 课程 | 老师 | 老师职称 | 教室 | 上课时间 |
小明 | 一年级语文(上) | 大宝 | 副教授 | 101 | 14:30 |
学生上课表新unix
课程 | 教材 |
一年级语文(上) | 《小学语文1》 |
课程的表 第三范式(3NF):符合2NF,而且,消除传递依赖
上面的“学生上课表新”符合2NF,能够这样验证:两个主属性单独使用,不用肯定其它四个非主属性的任何一个。可是它有传递依赖!
在哪呢?问题就出在“老师”和“老师职称”这里。一个老师必定能肯定一个老师职称。
有什么问题吗?想一想:
一、老师升级了,变教授了,要改数据库,表中有N条,改了N次……(修改异常)
二、没人选这个老师的课了,老师的职称也没了记录……(删除异常)
三、新来一个老师,还没分配教什么课,他的职称记到哪?……(插入异常)
那应该怎么解决呢?和上面同样,投影分解:
htm
学生 | 课程 | 老师 | 教室 | 上课时间 |
小明 | 一年级语文(上) | 大宝 | 101 | 14:30 |
老师 | 老师职称 |
大宝 | 副教授 |
BC范式(BCNF):符合3NF,而且,主属性不依赖于主属性
若关系模式属于第一范式,且每一个属性都不传递依赖于键码,则R属于BC范式。
一般
BC范式的条件有多种等价的表述:每一个非平凡依赖的左边必须包含键码;每一个决定因素必须包含键码。
BC范式既检查非主属性,又检查主属性。当只检查非主属性时,就成了第三范式。知足BC范式的关系都必然知足第三范式。
还能够这么说:若一个关系达到了第三范式,而且它只有一个候选码,或者它的每一个候选码都是单属性,则该关系天然达到BC范式。
通常,一个数据库设计符合3NF或BCNF就能够了。在BC范式以上还有第四范式、第五范式。
第四范式:要求把同一表内的多对多关系删除。
第五范式:从最终结构从新创建原始结构。
但在绝大多数应用中不须要设计到这种程度。而且,某些状况下,过于范式化甚至会对数据库的逻辑可读性和使用效率起到阻碍。数据库中必定程度的冗余并不必定是坏事情。若是你对第四范式、第五范式感兴趣能够看一看专业教材,从头学起,而且忘记我说的一切,以避免对你产生误导。blog