数据表的设计原则

时间 2019-11-20

标签数据表设计原则繁體版

原文原文链接

(1)不该针对整个系统进行数据库设计，而应该根据系统架构中的组件划分，针对每一个组件所处理的业务进行组件单元的数据库设计；不一样组件间所对应的数据库表之间的关联应尽量减小，若是不一样组件间的表须要外键关联也尽可能不要建立外键关联，而只是记录关联表的一个主键，确保组件对应的表之间的独立性，为系统或表结构的重构提供可能性。 (2)采用领域模型驱动的方式和自顶向下的思路进行数据库设计，首先分析系统业务，根据职责定义对象。对象要符合封装的特性，确保与职责相关的数据项被定义在一个对象以内，这些数据项可以完整描述该职责，不会出现职责描述缺失。而且一个对象有且只有一项职责，若是一个对象要负责两个或两个以上的职责，应进行分拆。 (3)根据创建的领域模型进行数据库表的映射，此时应参考数据库设计第二范式：一个表中的全部非关键字属性都依赖于整个关键字。关键字能够是一个属性，也能够是多个属性的集合，不论那种方式，都应确保关键字可以保证惟一性。在肯定关键字时，应保证关键字不会参与业务且不会出现更新异常，这时，最优解决方案为采用一个自增数值型属性或一个随机字符串做为表的关键字。 (4)因为第一点所述的领域模型驱动的方式设计数据库表结构，领域模型中的每个对象只有一项职责，因此对象中的数据项不存在传递依赖，因此，这种思路的数据库表结构设计从一开始即知足第三范式：一个表应知足第二范式，且属性间不存在传递依赖。 (5)一样，因为对象职责的单一性以及对象之间的关系反映的是业务逻辑之间的关系，因此在领域模型中的对象存在主对象和从对象之分，从对象是从1－N或N－N的角度进一步主对象的业务逻辑，因此从对象及对象关系映射为的表及表关联关系不存在删除和插入异常。 (6)在映射后得出的数据库表结构中，应再根据第四范式进行进一步修改，确保不存在多值依赖。这时，应根据反向工程的思路反馈给领域模型。若是表结构中存在多值依赖，则证实领域模型中的对象具备至少两个以上的职责，应根据第一条进行设计修正。第四范式：一个表若是知足BCNF，不该存在多值依赖。 (7)在通过分析后确认全部的表都知足2、3、四范式的状况下，表和表之间的关联尽可能采用弱关联以便于对表字段和表结构的调整和重构。而且，我认为数据库中的表是用来持久化一个对象实例在特定时间及特定条件下的状态的，只是一个存储介质，因此，表和表之间也不该用强关联来表述业务（数据间的一致性），这一职责应由系统的逻辑层来保证，这种方式也确保了系统对于不正确数据（脏数据）的兼容性。固然，从整个系统的角度来讲咱们仍是要尽最大努力确保系统不会产生脏数据，单从另外一个角度来讲，脏数据的产生在必定程度上也是不可避免的，咱们也要保证系统对这种状况的容错性。这是一个折中的方案。 (8)应针对全部表的主键和外键创建索引，有针对性的（针对一些大数据量和经常使用检索方式）创建组合属性的索引，提升检索效率。虽然创建索引会消耗部分系统资源，但比较起在检索时搜索整张表中的数据尤为时表中的数据量较大时所带来的性能影响，以及无索引时的排序操做所带来的性能影响，这种方式仍然是值得提倡的。 (9)尽可能少采用存储过程，目前已经有不少技术能够替代存储过程的功能如“对象/关系映射”等，将数据一致性的保证放在数据库中，不管对于版本控制、开发和部署、以及数据库的迁移都会带来很大的影响。但不能否认，存储过程具备性能上的优点，因此，当系统可以使用的硬件不会获得提高而性能又是很是重要的质量属性时，可通过平衡考虑选用存储过程。 (10)当处理表间的关联约束所付出的代价（经常是使用性上的代价）超过了保证不会出现修改、删除、更改异常所付出的代价，而且数据冗余也不是主要的问题时，表设计能够不符合四个范式。四个范式确保了不会出现异常，但也可能由此致使过于纯洁的设计，使得表结构难于使用，因此在设计时须要进行综合判断，但首先确保符合四个范式，而后再进行精化修正是刚刚进入数据库设计领域时能够采用的最好办法。 (11)设计出的表要具备较好的使用性，主要体如今查询时是否须要关联多张表且还需使用复杂的SQL技巧。 (12)设计出的表要尽量减小数据冗余，确保数据的准确性，有效的控制冗余有助于提升数据库的性能。