一张原始单证对应五个实体,即一张本来票据对应且只对应一个实体

1. 土生土长票据与实体之间的涉及
  可以是异常、一对多、多对多的涉嫌。在形似情状下,它们是一对一的涉及:即一张原始票据对应且只对应一个实体。
在出色意况下,它们或者是一对多或多对一的涉嫌,即一张本来单证对应多少个实体,或多张原始单证对应一个实体。
这里的实体可以清楚为基本表。明确这种对应关系后,对咱们计划录入界面大有实益。
  〖例1〗:一份员工履历资料,在人力资源消息系列中,就对应两个基本表:员工基本境况表、社会关系表、工作简历表。
        这就是“一张原始单证对应四个实体”的名列前茅例证。
2. 主键与外键   一般而言,一个实体不可能既无主键又无外键。在E—R
图中, 处于叶子部位的实体, 可以定义主键,也足以不定义主键
  (因为它无子孙), 但必须要有外键(因为它有二叔)。
  主键与外键的设计,在大局数据库的宏图中,占有举足轻重地位。当全局数据库的计划性完成之后,有个美利坚合众国数据库设计专
  家说:“键,到处都是键,除了键之外,什么也不曾”,这就是她的数据库设计经验之谈,也反映了他对信息序列核
  心(数据模型)的惊人抽象思维。因为:主键是实业的可观抽象,主键与外键的配对,表示实体之间的接连。
3. 基本表的属性
  基本表与中间表、临时表不同,因为它抱有如下多少个特征:    (1)
原子性。基本表中的字段是不可再解释的。    (2)
原始性。基本表中的记录是原始数据(基础数据)的笔录。    (3)
演绎性。由基本表与代码表中的数量,可以派生出装有的输出数据。    (4)
稳定性。基本表的构造是争持安静的,表中的笔录是要深远保存的。
  精晓基本表的性能后,在设计数据库时,就能将基本表与中间表、临时表区分开来。
4. 范式标准   基本表及其字段之间的关系,
应竭尽满意第三范式。不过,满足第三范式的数据库设计,往往不是最好的计划。
  为了加强数据库的运行效用,平常需要降低范式标准:适当扩充冗余,达到以空间换时间的目的。
  〖例2〗:有一张存放商品的基本表,如表1所示。“金额”这多少个字段的留存,注解该表的宏图不满足第三范式,
  因为“金额”可以由“单价”乘以“数量”得到,表明“金额”是冗余字段。不过,扩展“金额”这么些冗余字段,
  可以增强查询总括的进度,这就是以空间换时间的作法。   在Rose2002中,规定列有两序列型:数据列和总计列。“金额”这样的列被称呼“总计列”,而“单价”和
  “数量”这样的列被誉为“数据列”。
  表1 商品表的表结构   商品名称 商品型号 单价 数量 金额   电视机29吋 2,500 40 100,000    5. 浅显地领悟六个范式
  通俗地了然几个范式,对于数据库设计大有利益。在数据库设计中,为了更好地拔取两个范式,就不可能不通俗地精通  六个范式(通俗地领悟是够用的了解,并不是最不利最可靠的了解):
  第一范式:1NF是对性能的原子性约束,要求性能具有原子性,不可再解释;
  第二范式:2NF是对记录的惟一性约束,要求记录有惟一标识,即实体的惟一性;
  第三范式:3NF是对字段冗余性的羁绊,即任何字段无法由其它字段派生出来,它要求字段没有冗余。
  没有冗余的数据库设计可以完成。不过,没有冗余的数据库未必是最好的数据库,有时为了加强运行成效,就务须降
  低范式标准,适当保留冗余数据。具体做法是:在概念数据模型设计时遵从第三范式,降低范式标准的办事置于物理
  数据模型设计时考虑。降低范式就是扩张字段,允许冗余。
6. 要善用识别与正确处理多对多的关系
  若六个实体之间存在多对多的关联,则应解除这种关联。消除的主意是,在两者之间扩展第五个实体。这样,原来一
  个多对多的涉及,现在改为四个一对多的关联。要将原来两个实体的习性合理地分配到四个实体中去。这里的第三个  实体,实质上是一个较复杂的涉及,它对应一张基本表。一般来讲,数据库设计工具不可能辨别多对多的关系,但能处
  理多对多的涉嫌。
  〖例3〗:在“教室信息系列”中,“图书”是一个实体,“读者”也是一个实体。这七个实体之间的涉嫌,是一
  个特出的多对多涉及:一本书籍在不同时间足以被五个读者借阅,一个读者又足以借多本书籍。为此,要在双方之
  间扩充第两个实体,该实体取名为“借还书”,它的性能为:借还时间、借还表明(0意味借书,1意味还书),另外,
  它还应有有三个外键(“图书”的主键,“读者”的主键),使它能与“图书”和“读者”连接。
7. 主键PK的取值方法   
PK是供程序员使用的表间连接工具,能够是一无物理意思的数字串,
由程序自动加1来贯彻。也足以是有大体意义
  的字段名或字段名的组合。不过前者比后者好。当PK是字段名的构成时,提议字段的个数不要太多,多了不但索引
  占用空间大,而且速度也慢。
8. 正确认识数据冗余   主键与外键在多表中的重复现身,
不属于数据冗余,这多少个定义必须精通,事实上有成千上万人还不清楚。非键字段的重
  复出现,
才是数码冗余!而且是一种低级冗余,即重复性的冗余。高级冗余不是字段的重复出现,而是字段的派生现身。
  〖例4〗:商品中的“单价、数量、金额”两个字段,“金额”就是由“单价”乘以“数量”派生出来的,它就是冗余,
  而且是一种高级冗余。冗余的目标是为了加强处理速度。只有初级冗余才会追加数量的不一致性,因为相同数据,可
  能从不同时间、地点、角色上频繁录入。因而,大家提倡高级冗余(派生性冗余),反对低级冗余(重复性冗余)。
9. E–R图没有标准答案
  信息类别的E–R图没有标准答案,因为它的宏图与画法不是惟一的,只要它覆盖了系统要求的业务范围和意义内容,
  就是行之有效的。反之要修改E–R图。就算它没有惟一的标准答案,并不意味可以擅自设计。好的E—R图的业内是:
  结构清晰、关联简洁、实体个数适中、属性分配合理、没有低级冗余。
10 . 视图技术在数据库设计中很有用
  与基本表、代码表、中间表不同,视图是一种虚表,它凭借数据源的实表而存在。视图是供程序员使用数据库的
  一个窗口,是基表数据综合的一种样式,
是数据处理的一种格局,是用户数量保密的一种手段。为了拓展复杂处理、
  提升运算速度和节省存储空间, 视图的概念深度一般不足抢先三层。
若三层视图仍不够用, 则应在视图上定义临时表,   
在临时表上再定义视图。这样翻来覆去交迭定义, 视图的纵深就不受限制了。
  对于一些与国家政治、经济、技术、军事和平安利益有关的信息系列,视图的效率越来越重大。这么些系列的基本表完
  成物理设计之后,顿时在基本表上树立第一层视图,这层视图的个数和布局,与基本表的个数和结构是完全相同。
  并且规定,所有的程序员,一律只准在视图上操作。只有数据库管理员,带着六个人口联合了解的“安全钥匙”,
  才能一向在基本表上操作。请读者思考:这是为啥?
11. 中间表、报表和临时表
  中间表是存放总计数据的表,它是为数据仓库、输出报表或询问结果而设计的,有时它没有主键与外键(数据仓
  库除外)。临时表是程序员个人计划的,存放临时记录,为民用所用。基表和中间表由DBA维护,临时表由程序员
  自己用程序自动珍爱。
12. 完整性约束表现在两个方面
  域的完整性:用Check来兑现约束,在数据库设计工具中,对字段的取值范围拓展定义时,有一个Check按钮,通
  过它定义字段的值城。   参照完整性:用PK、FK、表级触发器来促成。
  用户定义完整性:它是有的业务规则,用存储过程和触发器来兑现。
13. 预防数据库设计打补丁的法子是“三少原则”    (1)
一个数据库中表的个数越少越好。只有表的个数少了,才能表明系统的E–R图少而精,去掉了再次的剩下的
    实体,形成了对创制世界的惊人抽象,举行了系统的数额集成,制止了打补丁式的统筹;
   (2)
一个表中组合主键的字段个数越少越好。因为主键的效率,一是建主键索引,二是做为子表的外键,所以组
    合主键的字段个数少了,不仅节省了运行时刻,而且节省了目录存储空间;
   (3)
一个表中的字段个数越少越好。只有字段的个数少了,才能声明在系统中不设有数量再次,且很少有数量冗
    余,更首要的是督促读者学会“列变行”,这样就避免了将子表中的字段拉入到主表中去,在主表中留给许
    多空余的字段。所谓“列变行”,就是将主表中的一有些内容拉出去,此外单独建一个子表。这几个点子很简
    单,有的人就是不习惯、不选用、不举办。
  数据库设计的实用原则是:在数量冗余和处理速度之间找到确切的平衡点。“三少”是一个整机概念,综合观点,
  不可能孤立某一个准绳。该条件是绝对的,不是相对的。“三多”原则肯定是张冠李戴的。试想:若覆盖体系一样的功
  能,一百个实体(共一千个属性)
的E–R图,肯定比二百个实体(共二千个特性) 的E–R图,要好得多。
  提倡“三少”原则,是叫读者学会运用数据库设计技术举行系统的数码集成。数据集成的手续是将文件系统集成
  为利用数据库,将采纳数据库集成为大旨数据库,将核心数据库集成为全局综合数据库。集成的品位越高,数据
  共享性就越强,信息孤岛现象就越少,整个集团音讯系列的全局E—R图中实体的个数、主键的个数、属性的个数
  就会越少。
  提倡“三少”原则的目标,是制止读者利用打补丁技术,不断地对数据库举行增删改,使公司数据库变成了自由
  设计数据库表的“垃圾堆”,或数量库表的“大杂院”,最终造成数据库中的基本表、代码表、中间表、临时表
  杂乱无章,不计其数,导致企事业单位的音讯系列不可以尊崇而瘫痪。
  
“三多”原则任谁都得以完成,该规则是“打补丁方法”设计数据库的歪艺术学说。“三少”原则是少而精的
  原则,它要求有较高的数据库设计技术与格局,不是任什么人都能不负众望的,因为该规则是杜绝用“打补丁方法”
  设计数据库的理论依照。
14. 增强数据库运行效能的章程
  在加以的系统硬件和连串软件条件下,升高数据库系统的运转功效的不二法门是:
   (1) 在数据库物理设计时,降低范式,扩大冗余, 少用触发器,
多用存储过程。    (2)
当总结异常复杂、而且记录条数极度了不起时(例如一千万条),复杂总括要先在数据库外面,以文件系统方
    式用C++语言总计处理完了未来,最终才入库追加到表中去。那是电信计费系统规划的经历。
   (3)
发现某个表的笔录太多,例如抢先一千万条,则要对该表举办水平划分。水平划分的做法是,以该表主键
    PK的某个值为界线,将该表的记录水平划分为三个表。若发现某个表的字段太多,例如超过八十个,则
    垂直细分该表,将本来的一个表分解为两个表。    (4)
对数据库管理类别DBMS举办系统优化,即优化各个系统参数,如缓冲区个数。
   (5) 在使用面向数据的SQL语言举行程序设计时,尽量利用优化算法。
    总而言之,要提高数据库的周转功用,必须从数据库系统级优化、数据库设计级优化、程序实现级优化,这三
    个层次上还要下功夫。
  上述十三个技巧,是许三人在大量的数据库分析与计划执行中,逐步总括出来的。对于那么些经历的行使,读者无法生帮硬套,死记硬背,而要消化领悟,实事求是,灵活领会。并逐年到位:在应用中升华,在迈入中利用。

      13. 制止数据库设计打补丁的章程是“三少原则” 
    
       (1) 一个数据库中表的个数越少越好。只有表的个数少了,才能印证系统的E–R图少而精,去掉了重复的多余的实体,形成了对客观世界的万丈抽象,举行了系统的数码集成,制止了打补丁式的统筹; 
     
       (2) 一个表中组合主键的字段个数越少越好。因为主键的职能,一是建主键索引,二是做为子表的外键,所以组合主键的字段个数少了,不仅节省了运行时刻,而且节省了目录存储空间; 
     
       (3) 一个表中的字段个数越少越好。唯有字段的个数少了,才能表明在系统中不存在数量再一次,且很少有多少冗余,更着重的是督促读者学会“列变行”,这样就制止了将子表中的字段拉入到主表中去,在主表中留给不少空余的字段。所谓“列变行”,就是将主表中的一局部情节拉出去,此外单独建一个子表。那个艺术很简单,有的人就是不习惯、不选取、不实施。 
   
      数据库设计的实用原则是:在数额冗余和处理速度之间找到确切的平衡点。“三少”是一个完好无缺概念,综合观点,不可以孤立某一个原则。该标准是对峙的,不是相对的。“三多”原则肯定是大错特错的。试想:若覆盖体系一样的职能,一百个实体(共一千个特性) 的E–R图,肯定比二百个实体(共二千个属性) 的E–R图,要好得多。 
   
      提倡“三少”原则,是叫读者学会使用数据库设计技术拓展系统的数目集成。数据集成的步子是将文件系统集成为应用数据库,将采取数据库集成为主旨数据库,将主题数据库集成为全局综合数据库。集成的水平越高,数据共享性就越强,信息孤岛现象就越少,整个公司音讯类此外全局E?R图中实体的个数、主键的个数、属性的个数就会越少。 
   
      提倡“三少”原则的目的,是制止读者利用打补丁技术,不断地对数据库进行增删改,使公司数据库变成了任性设计数据库表的“垃圾堆”,或数额库表的“大杂院”,最终导致数据库中的基本表、代码表、中间表、临时表杂乱无章,不计其数,导致企事业单位的信息体系不可能珍视而瘫痪。 
    
      “三多”原则任什么人都足以成功,该规范是“打补丁方法”设计数据库的歪教育学说。“三少”原则是少而精的标准化,它要求有较高的数据库设计技术与方法,不是任什么人都能完成的,因为该标准是杜绝用“打补丁方法”设计数据库的理论按照。 

转载自:http://www.javaeye.com/topic/281611

      〖例3〗:在“教室音信序列”中,“图书”是一个实体,“读者”也是一个实体。这三个实体之间的关联,是一个顶级的多对多涉及:一本书籍在不同时间足以被两个读者借阅,一个读者又可以借多本书籍。为此,要在二者之间扩展第六个实体,该实体取名为“借还书”,它的特性为:借还时间、借还讲明(0代表借书,1代表还书),其它,它还应该有五个外键(“图书”的主键,“读者”的主键),使它能与“图书”和“读者”连接。 

      精晓基本表的性质后,在计划数据库时,就能将基本表与中间表、临时表区分开来。 

      〖例4〗:商品中的“单价、数量、金额”两个字段,“金额”就是由“单价”乘以“数量”派生出来的,它就是冗余,而且是一种高级冗余。冗余的目标是为了加强处理速度。只有初级冗余才会扩充多少的不一致性,因为同样数据,可能从不同时间、地方、角色上往往录入。因而,我们提倡高级冗余(派生性冗余),反对低级冗余(重复性冗余)。 

      10. 视图技术在数据库设计中很有用 
   
      与基本表、代码表、中间表不同,视图是一种虚表,它凭借数据源的实表而留存。视图是供程序员使用数据库的一个窗口,是基表数据汇总的一种模式, 是数据处理的一种艺术,是用户数量保密的一种手段。为了拓展复杂处理、提高运算速度和节省存储空间, 视图的概念深度一般不足超越三层。 若三层视图仍不够用, 则应在视图上定义临时表, 在临时表上再定义视图。这样频繁交迭定义, 视图的深度就不受限制了。 

      〖例1〗:一份员工履历资料,在人力资源音信序列中,就对应五个基本表:员工基本情形表、社会关系表、工作简历表。这就是“一张本来单证对应四个实体”的一枝独秀例证。 

      7. 主键PK的取值方法 
    
      PK是供程序员使用的表间连接工具,可以是一无物理意思的数字串, 由程序自动加1来兑现。也足以是有物理意义的字段名或字段名的整合。可是前者比继承者好。当PK是字段名的重组时,指出字段的个数不要太多,多了不但索引占用空间大,而且速度也慢。 

      4. 范式标准 
  
      基本表及其字段之间的关联, 应竭尽满足第三范式。但是,满足第三范式的数据库设计,往往不是最好的计划。为了增强数据库的运转功效,平日需要降低范式标准:适当扩展冗余,达到以空间换时间的目标。 

      3. 基本表的习性 
   
      基本表与中间表、临时表不同,因为它有着如下六个性状: 
    
        (1) 原子性。基本表中的字段是不可再解释的。 
      (2) 原始性。基本表中的记录是原来数据(基础数据)的笔录。 
      (3) 演绎性。由基本表与代码表中的多寡,可以派生出装有的出口数据。 
      (4) 稳定性。基本表的社团是相对稳定性的,表中的笔录是要长久保存的。 

      14. 提高数据库运行效率的不二法门 
   
      在给定的系列硬件和序列软件条件下,提升数据库系统的运作效率的点子是: 
       (1) 在数据库物理设计时,降低范式,扩充冗余, 少用触发器, 多用存储过程。 
       
       (2) 当总结相当复杂、而且记录条数相当了不起时(例如一千万条),复杂统计要先在数据库外面,以文件系统情势用C++语言总结处理完了之后,最后才入库追加到表中去。这是电信计费系统规划的经验。 
   
       (3) 发现某个表的笔录太多,例如超过一千万条,则要对该表举行水平划分。水平划分的做法是,以该表主键PK的某部值为界线,将该表的记录水平划分为四个表。若发现某个表的字段太多,例如超过八十个,则垂直细分该表,将本来的一个表分解为五个表。 
   
       (4) 对数据库管理连串DBMS进行系统优化,即优化各个系统参数,如缓冲区个数。 
   
       (5) 在运用面向数据的SQL语言举行程序设计时,尽量选择优化算法。 
  
      总而言之,要增强数据库的运行效用,必须从数据库系统级优化、数据库设计级优化、程序实现级优化,这两个层次上还要下功夫。

1. 土生土长票据与实业之间的关联 
   
      可以是一定、一对多、多对多的涉嫌。在相似意况下,它们是万分的涉及:即一张原始票据对应且只对应一个实体。在特别意况下,它们或者是一对多或多对一的涉嫌,即一张本来单证对应四个实体,或多张本来单证对应一个实体。这里的实业可以领略为基本表。明确这种对应关系后,对我们设计录入界面大有便宜。 

      9. E–R图没有标准答案 
   
      音信体系的E–R图没有标准答案,因为它的计划性与画法不是无比的,只要它覆盖了系统要求的业务范围和功效内容,就是卓有功用的。反之要修改E–R图。就算它并未惟一的标准答案,并不意味可以随意设计。好的E?R图的科班是:结构清晰、关联简洁、实体个数适中、属性分配合理、没有低级冗余。 

      11. 中间表、报表和临时表 
   
      中间表是存放总结数据的表,它是为数据仓库、输出报表或询问结果而设计的,有时它没有主键与外键(数据仓库除外)。临时表是程序员个人计划的,存放临时记录,为私有所用。基表和中间表由DBA维护,临时表由程序员自己用程序自动珍重。 

      6. 要善于识别与正确处理多对多的涉嫌 
       
      若多少个实体之间存在多对多的涉嫌,则应去掉那种关系。消除的法子是,在两者之间扩大第三个实体。这样,原来一个多对多的关联,现在成为三个一对多的关系。要将原本多个实体的特性合理地分配到五个实体中去。这里的第七个实体,实质上是一个较复杂的关联,它对应一张基本表。一般来讲,数据库设计工具不可能分辨多对多的涉嫌,但能处理多对多的涉及。 

      〖例2〗:有一张存放商品的基本表,如表1所示。“金额”这一个字段的存在,注明该表的计划性不知足第三范式,因为“金额”可以由“单价”乘以“数量”拿到,说明“金额”是冗余字段。不过,扩张“金额”这些冗余字段,可以增长查询总结的速度,这就是以空间换时间的作法。 
   
      在罗丝(Rose) 2002中,规定列有两种档次:数据列和总结列。“金额”这样的列被号称“总计列”,而“单价”和“数量”这样的列被称之为“数据列”。 
   
      表1 商品表的表结构 
    商品名称 商品型号 单价 数量 金额 
    电视机 29? 2,500 40 100,000 
    
      5. 浅显地明白六个范式 
   
      通俗地了解六个范式,对于数据库设计大有利益。在数据库设计中,为了更好地动用五个范式,就非得通俗地领略六个范式(通俗地精通是够用的接头,并不是最正确最可靠的敞亮): 
   
      第一范式:1NF是对性能的原子性约束,要求性能具有原子性,不可再解释; 
    第二范式:2NF是对记录的惟一性约束,要求记录有惟一标识,即实体的惟一性; 
    第三范式:3NF是对字段冗余性的封锁,即任何字段不可以因此外字段派生出来,它要求字段没有冗余. 
   
      没有冗余的数据库设计能够成功。可是,没有冗余的数据库未必是最好的数据库,有时为了增进运行效能,就非得降低范式标准,适当保留冗余数据。具体做法是:在概念数据模型设计时死守第三范式,降低范式标准的干活嵌入物理数据模型设计时考虑。降低范式就是增多字段,允许冗余。 

      2. 主键与外键 
   
      一般而言,一个实体无法既无主键又无外键。在E?R 图中, 处于叶子部位的实体, 可以定义主键,也可以不定义主键(因为它无子孙), 但必须要有外键(因为它有四叔)。 
   
      主键与外键的计划,在全局数据库的筹划中,占有举足轻重地方。当全局数据库的规划完成将来,有个美利坚同盟国数据库设计大方说:“键,到处都是键,除了键之外,什么也从没”,这就是他的数据库设计经验之谈,也突显了她对信息系统焦点(数据模型)的万丈抽象思维。因为:主键是实体的中度抽象,主键与外键的交配,表示实体之间的连续。 

      12. 完整性约束表现在几个地点 
   
      域的完整性:用Check来促成约束,在数据库设计工具中,对字段的取值范围开展定义时,有一个Check按钮,通过它定义字段的值城。参照完整性:用PK、FK、表级触发器来贯彻。用户定义完整性:它是有些作业规则,用存储过程和触发器来促成。 

      对于一些与国家政治、经济、技术、军事和池州利益有关的信息序列,视图的效益更加重大。这么些体系的基本表完成物理设计之后,即刻在基本表上树立第一层视图,这层视图的个数和结构,与基本表的个数和协会是完全相同。并且规定,所有的程序员,一律只准在视图上操作。只有数据库管理员,带着四人口一道精晓的“安全钥匙”,才能一向在基本表上操作。请读者思考:那是干吗? 

      8. 正确认识数据冗余 
   
      主键与外键在多表中的重复出现, 不属于数据冗余,这多少个定义必须领悟,事实上有无数人还不知道。非键字段的再现, 才是数额冗余!而且是一种低级冗余,即重复性的冗余。高级冗余不是字段的双再出现,而是字段的派生现身。