---恢复内容开始---sql
数据库范式(Normal forms):是用于规范关系型数据库设计,以减小谬误发生的一种准则。数据库
尽管有不少概念定义性的东西,可是在实际使用数据库的过程当中仍然有不少不尽人意的地方,下面我经过一些实例和图片简要分析一下范式的特色,也是我对范式的一下我的的理解。本篇随笔咱们主要经过第一范式(1nf),第二范式(2nf),第三范式(3nf)和bcnf范式,其中咱们重点关注的就是第一范式。数据库设计
第一范式,第一范式是关系型数据库的基础条件,我将1nf的特色概括为如下几点:函数
1.不容许出现重复的行;性能
2.没有重复的列;spa
3. 每列(或者每一个属性)都是不可再分的最小数据单元,即符合原子性;设计
举例说明:列值中含有分隔符或者属性字符串意义相同。3d
不难发现第一个图中爱好这一列能够分解为两列,如右图中所示,可是这样就不符合1nf要求的列不可再分的要求,右图也不符合没有重复列的要求,不符合1nf。orm
符合第一范式应该以下图所示(同时去掉第一个表的爱好字段):blog
那么符合第一范式带来的好处:减小了代码的繁琐(好比Substring等的频繁使用),提升了查询的效率,方便使用关键字搜索,提升了数据库的性能。
第二范式,2nf依赖1nf,因此2nf必须符合1nf,而后第二范式须要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。
举例说明:
如图所示,咱们将Name和City两个属性做为主键,省份这个字段依赖于城市这个字段,同时不依赖于Name这个字段,根据城市能够肯定省份。省份跟Name没有关系不符合第二范式。
应该将省市单独拿出来独立成表(AddressID,Province,City),主表则变成(ID,Name,AddressID),经过AddressID关联。解决了可能存在的数据冗余、插入、删除和更新异常。
第三范式,消除对主键的传递依赖,简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。
下面我直接给你们看一个正确的第三范式的例子:
所谓传递依赖就是这样的逻辑:订单编号-》客户编号-》客户名称...这样的依赖不该该在一个表里面(主键是订单编号),如图,客户名称、所属公司、联系方式,依赖于客户编号,分解成两个表之后消除了非主键的传递依赖。
BCNF(Boyce-Codd normal form),在3NF的基础上,表中任何字段对任一候选关键字段的传递函数依赖都不存在。
定义:任何F可推导出的函数依赖X->A都在T中,这里A是不在X中的单一属性,X必须是T的一个超键。当一个数据库模式包含的全部表都符合BCNF时,这个数据库被称为符合BCNF.---这东西实在是太晦涩了。
个人理解:它要求关系模型中全部的属性(包括主属性和非主属性)都不传递依赖于任何候选关键字。也就是说,当关系型表中功能上互相依赖的那些列的每一列都是一个候选关键字时候。
UserID Name ProductID UserEmail ProducName
1 tom 1 ttt@sina.com box
首先拆分红两个表
UserID Name UserEmail
1 tom ttt@sina.com
ProductID ProducName
1 box
这样没有任何主属性和非主属性的传递依赖了,可是缺乏的是UserID 和ProductID的关系,咱们还要加入关系表
UserID ProductID
1 1
总结:就关系数据库而言,从其余元素中消除数据冗余问题,去除重复每每以减小冗余, 从特定的表中最小化冗余意味着摆脱没必要要的数据。 在商业环境中,绝大多数超越第3范式的设计都是不切实际的。 由范式的进阶来看,越高等级的范式所产生的表越多,而在应用程序使用的过程当中越多的表Join和查询形成的性能损耗的问题,甚至不少状况下为了兼顾性能和开发咱们甚至要作一下反范式的操做,这个我准备接下来单独说一下。
通常认为超过第三范式都是多余的,因此再实际工做中不能太过教条,这里讨论更可能是理解概念的一些讨论,经过总结以上这些概念帮助咱们更好的设计,可是只有按照实际需求来设计才是王道。哈哈