即一张原始票据对应且只对应贰个实体,或多张本来单证对应一个实体

1. 原来票据与实业之间的涉及 
  能够是一对① 、一对多、多对多的涉及。在相似意况下,它们是一定的关联:即一张本来票据对应且只对应1个实体。 
在特种情状下,它们可能是一对多或多对一的涉嫌,即一张本来单证对应三个实体,或多张原始单证对应三个实体。 
那里的实体能够驾驭为基本表。显著那种对应关系后,对大家统一筹划录入界面大有好处。 

1. 土生土长票据与实业之间的关联 
   
      能够是万分、一对多、多对多的涉及。在形似情形下,它们是一定的关联:即一张本来票据对应且只对应三个实体。在至极情形下,它们恐怕是一对多或多对一的涉及,即一张本来单证对应多少个实体,或多张原始单证对应三个实体。那里的实体能够领略为基本表。明显那种对应关系后,对我们设计录入界面大有便宜。 

  〖例1〗:一份职员和工人履历资料,在人力资源新闻体系中,就对应五个基本表:职员和工人基本景况表、社会关系表、工作简历表。 
        那正是“一张本来单证对应多少个实体”的天下第②例子。 

      〖例1〗:一份职员和工人履历资料,在人力资源新闻种类中,就对应多少个基本表:职员和工人基本情状表、社会关系表、工作简历表。那正是“一张本来单证对应八个实体”的卓著事例。 

2. 主键与外键 
  一般而言,三个实体不能够既无主键又无外键。在E—RAV4 图中,
处于叶子部位的实体, 能够定义主键,也得以不定义主键 
  (因为它无子孙), 但必供给有外键(因为它有老爹)。 

      2. 主键与外键 
   
      一般而言,一个实体不可能既无主键又无外键。在E?凯雷德 图中, 处于叶子部位的实体, 能够定义主键,也足以不定义主键(因为它无子孙), 但必供给有外键(因为它有老爸)。 
   
      主键与外键的规划,在大局数据库的统一筹划中,占有主要位置。当全局数据库的设计到位以往,有个U.S.数据库设计大方说:“键,四处都是键,除了键之外,什么也从未”,那正是他的数据库设计经验之谈,也反映了他对新闻系统宗旨(数据模型)的高度抽象思维。因为:主键是实业的莫斯中国科学技术大学学抽象,主键与外键的杂交,表示实体之间的连天。 

  主键与外键的筹划,在大局数据库的筹划中,占有主要地位。当全局数据库的规划到位未来,有个美利坚合众国数据库设计专 
  家说:“键,随处都以键,除了键之外,什么也并未”,那就是她的数据库设计经验之谈,也展示了他对音讯体系核 
  心(数据模型)的中度抽象思维。因为:主键是实业的莫斯中国科学技术大学学抽象,主键与外键的杂交,表示实体之间的接连。 

      3. 基本表的性质 
   
      基本表与中间表、权且表区别,因为它富有如下五个特色: 
    
        (1) 原子性。基本表中的字段是不足再解释的。 
      (2) 原始性。基本表中的记录是原始数据(基础数据)的笔录。 
      (3) 演绎性。由基本表与代码表中的数码,可以派生出具有的出口数据。 
      (4) 稳定性。基本表的构造是争论稳定性的,表中的笔录是要深切保存的。 

3. 基本表的习性    基本表与中间表、权且表分裂,因为它抱有如下两性情状: 
   (1) 原子性。基本表中的字段是不行再解释的。 
   (2) 原始性。基本表中的记录是原始数据(基础数据)的笔录。 
   (3) 演绎性。由基本表与代码表中的数码,能够派生出具有的出口数据。 
   (4) 稳定性。基本表的构造是相持稳定性的,表中的笔录是要深刻保存的。 
  精通基本表的天性后,在规划数据库时,就能将基本表与中间表、权且表区分开来。 

      掌握基本表的习性后,在筹划数据库时,就能将基本表与中间表、权且表区分开来。 

4. 范式标准    基本表及其字段之间的涉嫌,
应竭尽满意第贰范式。不过,满意第壹范式的数据库设计,往往不是最好的筹划。 
  为了增强数据库的运行成效,平时要求降低范式标准:适当扩充冗余,达到以空间换时间的指标。 

      4. 范式标准 
  
      基本表及其字段之间的关联, 应尽只怕满足第③范式。不过,满足第②范式的数据库设计,往往不是最好的筹划。为了增长数据库的运行功效,平日须要降低范式标准:适当扩大冗余,达到以空间换时间的目标。 

  〖例2〗:有一张存放商品的基本表,如表1所示。“金额”那个字段的留存,阐明该表的规划不满意第②范式, 
  因为“金额”能够由“单价”乘以“数量”获得,表明“金额”是冗余字段。不过,扩充“金额”那些冗余字段, 
  能够增强查询计算的快慢,那正是以空间换时间的作法。 
  在Rose二〇〇四中,规定列有二种档次:数据列和总结列。“金额”那样的列被叫做“总括列”,而“单价”和 
  “数量”那样的列被称作“数据列”。 

      〖例2〗:有一张存放商品的基本表,如表1所示。“金额”这一个字段的存在,评释该表的安排不满足第贰范式,因为“金额”能够由“单价”乘以“数量”获得,表达“金额”是冗余字段。可是,扩张“金额”那个冗余字段,能够增强查询总结的进程,那正是以空间换时间的作法。 
   
      在罗丝 2003中,规定列有两种类型:数据列和总计列。“金额”那样的列被称作“总括列”,而“单价”和“数量”那样的列被号称“数据列”。 
   
      表1 商品表的表结构 
    商品名称 商品型号 单价 数量 金额 
    电视机 29? 2,500 40 100,000 
    
      5. 开头地领略七个范式 
   
      通俗地了然多个范式,对于数据库设计大有利益。在数据库设计中,为了更好地行使多个范式,就非得通俗地领略多少个范式(通俗地掌握是够用的知情,并不是最不利最可信的接头): 
   
      第2范式:1NF是对品质的原子性约束,须要品质具有原子性,不可再解释; 
    第1范式:2NF是对记录的惟一性约束,须求记录有惟一标识,即实体的惟一性; 
    第叁范式:3NF是对字段冗余性的牢笼,即任何字段无法由别的字段派生出来,它供给字段没有冗余. 
   
      没有冗余的数据库设计能够完结。可是,没有冗余的数据库未必是最好的数据库,有时为了狠抓运转效能,就务须下降范式标准,适当保留冗余数据。具体做法是:在概念数据模型设计时服从第1范式,降低范式标准的行事嵌入物理数据模型设计时考虑。降低范式正是增多字段,允许冗余。 

  表1 商品表的表结构 
  商品名称 商品型号 单价 数量 金额 
  电视机 29吋 2,500 40 100,000 
   
5. 浅显地知道多少个范式 
  通俗地驾驭四个范式,对于数据库设计大有益处。在数据库设计中,为了更好地行使七个范式,就非得通俗地领会 
  多个范式(通俗地通晓是够用的精通,并不是最不利最精确的知道): 
  第①范式:1NF是对品质的原子性约束,供给质量具有原子性,不可再解释; 
  第三范式:2NF是对记录的惟一性约束,要求记录有惟一标识,即实体的惟一性; 
  第贰范式:3NF是对字段冗余性的羁绊,即任何字段无法由其余字段派生出来,它须要字段没有冗余。 

      6. 要善用识别与正确处理多对多的涉嫌 
       
      若多少个实体之间存在多对多的关系,则应去掉那种关系。消除的法子是,在两者之间增添第5个实体。那样,原来多个多对多的关联,未来改成七个一对多的关系。要将原本三个实体的性质合理地分配到四个实体中去。那里的第④个实体,实质上是三个较复杂的关联,它对应一张基本表。一般来讲,数据库设计工具不可能鉴定分别多对多的关系,但能处理多对多的涉嫌。 

  没有冗余的数据库设计能够达成。但是,没有冗余的数据库未必是最好的数据库,有时为了进步运转功用,就务须降 
  低范式标准,适当保留冗余数据。具体做法是:在概念数据模型设计时坚守第1范式,下降范式标准的干活置于物理 
  数据模型设计时考虑。下降范式正是增多字段,允许冗余。 

      〖例3〗:在“体育场面新闻种类”中,“图书”是3个实体,“读者”也是三个实体。那两个实体之间的关联,是3个出人头地的多对多涉及:一本书籍在分裂时间足以被七个读者借阅,三个读者又足以借多本书籍。为此,要在二者之间扩展第多个实体,该实体取名为“借还书”,它的质量为:借还时间、借还标明(0意味借书,1表示还书),其它,它还应有有七个外键(“图书”的主键,“读者”的主键),使它能与“图书”和“读者”连接。 

6. 要善用识别与正确处理多对多的关系    若三个实体之间存在多对多的关系,则应解除那种关系。化解的不二法门是,在两者之间扩展第多少个实体。那样,原来一 
  个多对多的涉及,未来改成多个一对多的关联。要将原来多少个实体的质量合理地分配到多个实体中去。这里的第⑤个 
  实体,实质上是一个较复杂的涉嫌,它对应一张基本表。一般来讲,数据库设计工具无法分辨多对多的涉及,但能处 
  理多对多的涉嫌。 

      7. 主键PK的取值方法 
    
      PK是供程序员使用的表间连接工具,能够是一无物理意思的数字串, 由程序自动加1来落到实处。也足以是有大体意义的字段名或字段名的组成。可是前者比后者好。当PK是字段名的结缘时,提出字段的个数不要太多,多了非但索引占用空间大,而且速度也慢。 

  〖例3〗:在“教室消息体系”中,“图书”是3个实体,“读者”也是二个实体。那两个实体之间的涉嫌,是一 
  个典型的多对多关系:一本书籍在不一致时间能够被多少个读者借阅,2个读者又足以借多本图书。为此,要在双方之 
  间扩张第⑥个实体,该实体取名为“借还书”,它的性质为:借还时间、借还注解(0表示借书,1象征还书),其它, 
  它还应有有五个外键(“图书”的主键,“读者”的主键),使它能与“图书”和“读者”连接。 

      8. 正确认识数据冗余 
   
      主键与外键在多表中的重复出现, 不属于数据冗余,这些概念必须清楚,事实上有无数人还不知道。非键字段的重现, 才是数额冗余!而且是一种低级冗余,即重复性的冗余。高级冗余不是字段的重复出现,而是字段的派生出现。 

7. 主键PK的取值方法     PK是供程序员使用的表间连接工具,能够是一无物理含义的数字串,
由程序自动加1来兑现。也能够是有大体意义 
  的字段名或字段名的组合。可是前者比继任者好。当PK是字段名的构成时,建议字段的个数不要太多,多了非但索引 
  占用空间大,而且速度也慢。 

      〖例4〗:商品中的“单价、数量、金额”多少个字段,“金额”便是由“单价”乘以“数量”派生出来的,它正是冗余,而且是一种高级冗余。冗余的指标是为了增长处理速度。唯有初级冗余才会增多多少的分裂性,因为同样数据,大概从不相同时间、地方、剧中人物上多次录入。由此,大家提倡高级冗余(派生性冗余),反对低级冗余(重复性冗余)。 

8. 正确认识数据冗余 
  主键与外键在多表中的重复出现,
不属于数据冗余,那么些定义必须了然,事实上有那个人还不领悟。非键字段的重 
  复出现,
才是数码冗余!而且是一种低级冗余,即重复性的冗余。高级冗余不是字段的重新出现,而是字段的派生出现。 

      9. E–Lacrosse图没有标准答案 
   
      音信系列的E–奇骏图没有标准答案,因为它的宏图与画法不是惟一的,只要它覆盖了系统供给的业务范围和意义内容,便是行得通的。反之要修改E–牧马人图。就算它没有惟一的标准答案,并不意味能够任意设计。好的E?Wrangler图的业内是:结构清晰、关联简洁、实体个数适中、属性分合作理、没有低级冗余。 

  〖例4〗:商品中的“单价、数量、金额”多少个字段,“金额”就是由“单价”乘以“数量”派生出来的,它就是冗余, 
  而且是一种尖端冗余。冗余的目标是为着进步处理速度。唯有初级冗余才会大增数据的分化性,因为相同数据,可 
  能从分裂时间、地方、剧中人物上翻来覆去录入。由此,大家倡导高级冗余(派生性冗余),反对低级冗余(重复性冗余)。 

      10. 视图技术在数据库设计中很有用 
   
      与基本表、代码表、中间表不一样,视图是一种虚表,它凭借数据源的实表而留存。视图是供程序员使用数据库的3个窗口,是基表数据汇总的一种方式, 是数据处理的一种方法,是用户数量保密的一种手段。为了拓展复杂处理、进步运算速度和节省存款和储蓄空间, 视图的概念深度一般不足超越三层。 若三层视图仍不够用, 则应在视图上定义一时表, 在近日表上再定义视图。那样反复交迭定义, 视图的深浅就不受限制了。 

9. E–猎豹CS6图没有标准答案 
  新闻种类的E–揽胜图没有标准答案,因为它的筹划与画法不是独一无二的,只要它覆盖了系统要求的业务范围和功用内容, 
  正是卓有效用的。反之要修改E–Odyssey图。就算它并未惟一的标准答案,并不意味着能够肆意设计。好的E—奥迪Q7图的行业内部是: 
  结构清晰、关联简洁、实体个数适中、属性分协作理、没有低级冗余。 

      对于某个与国家政治、经济、技术、军事和平安利益有关的新闻种类,视图的意义越来越重庆大学。这几个系统的基本表完毕物理设计之后,立时在基本表上确立第①层视图,那层视图的个数和布局,与基本表的个数和布局是完全相同。并且分明,全数的程序员,一律只准在视图上操作。唯有数据库管理员,带着几人口一起明白的“安全钥匙”,才能一贯在基本表上操作。请读者思考:那是为何? 

10 . 视图技术在数据库设计中很有用    与基本表、代码表、中间表不相同,视图是一种虚表,它依靠数据源的实表而留存。视图是供程序员使用数据库的 
  2个窗口,是基表数据汇总的一种样式,
是数据处理的一种艺术,是用户数据保密的一种手段。为了实行理并答复杂处理、 
  升高运算速度和节省存款和储蓄空间, 视图的定义深度一般不足当先三层。
若三层视图仍不够用, 则应在视图上定义一时表, 
   在近年来表上再定义视图。那样翻来覆去交迭定义, 视图的深浅就不受限制了。 

      11. 中间表、报表和目前表 
   
      中间表是存放计算数据的表,它是为数据仓库、输出报表或询问结果而规划的,有时它并未主键与外键(数据仓库除外)。一时半刻表是程序员个人安插的,存放如今记录,为个人所用。基表和中间表由DBA维护,一时表由程序员本人用程序自动敬爱。 

  对于某个与国家政治、经济、技术、军事和平安利益有关的消息种类,视图的作用特别重要。那么些系统的基本表完 
  成物理设计之后,马上在基本表上建立第①层视图,那层视图的个数和组织,与基本表的个数和布局是完全相同。 
  并且分明,全部的程序员,一律只准在视图上操作。唯有数据库管理员,带着五个人口一起驾驭的“安全钥匙”, 
  才能直接在基本表上操作。请读者思想:那是怎么? 

      12. 完整性约束表今后多少个方面 
   
      域的完整性:用Check来贯彻约束,在数据库设计工具中,对字段的取值范围拓展定义时,有三个Check按钮,通过它定义字段的值城。参照完整性:用PK、FK、表级触发器来达成。用户定义完整性:它是一些政工规则,用存款和储蓄进程和触发器来贯彻。 

11. 中间表、报表和方今表 
  中间表是存放总括数据的表,它是为数据仓库、输出报表或询问结果而安排的,有时它并未主键与外键(数据仓 
  库除外)。一时半刻表是程序员个人布署的,存放近日记录,为民用所用。基表和中间表由DBA维护,一时表由程序员 
  本身用程序自动爱护。 

      13. 防患数据库设计打补丁的不二法门是“三少原则” 
    
       (1) 七个数据库中表的个数越少越好。只有表的个数少了,才能表达系统的E–Lacrosse图少而精,去掉了再一次的剩余的实体,形成了对客观世界的莫斯中国科学技术大学学抽象,进行了系统的数量集成,防止了打补丁式的筹划; 
     
       (2) 多个表中组合主键的字段个数越少越好。因为主键的意义,一是建主键索引,二是做为子表的外键,所以组合主键的字段个数少了,不仅节省了运维时刻,而且节省了目录存款和储蓄空间; 
     
       (3) 1个表中的字段个数越少越好。唯有字段的个数少了,才能评释在系统中不设有数量再次,且很少有多少冗余,更关键的是督促读者学会“列变行”,那样就防止了将子表中的字段拉入到主表中去,在主表中留给不少空闲的字段。所谓“列变行”,正是将主表中的一有个别剧情拉出去,别的单独建1个子表。这一个艺术很简单,有的人便是不习惯、不选用、不进行。 
   
      数据库设计的实用原则是:在数额冗余和处理速度之间找到适当的平衡点。“三少”是3个全体概念,综合观点,不能够孤立某三个规则。该原则是周旋的,不是纯属的。“三多”原则肯定是大错特错的。试想:若覆盖种类一样的意义,九二十个实体(共一千个性格) 的E–Haval图,肯定比二百个实体(共二千个属性) 的E–PRADO图,要好得多。 
   
      提倡“三少”原则,是叫读者学会运用数据库设计技术拓展系统的数目集成。数据集成的步骤是将文件系统集成为应用数据库,将利用数据库集成为主旨数据库,将核心数据库集成为全局综合数据库。集成的水平越高,数据共享性就越强,音信孤岛现象就越少,整个集团音信连串的大局E?昂科威图中实体的个数、主键的个数、属性的个数就会越少。 
   
      提倡“三少”原则的目标,是防止读者利用打补丁技术,不断地对数据库进行增加和删除改,使集团数据库变成了随机设计数据库表的“垃圾堆”,或数额库表的“大杂院”,最后导致数据库中的基本表、代码表、中间表、最近表一塌糊涂,恒河沙数,导致企事业单位的新闻体系不可能保险而瘫痪。 
    
      “三多”原则任何人都得以成功,该条件是“打补丁方法”设计数据库的歪军事学说。“三少”原则是少而精的尺度,它供给有较高的数据库设计技术与方法,不是任何人都能不负众望的,因为该规则是杜绝用“打补丁方法”设计数据库的理论根据。 

12. 完整性约束表以往四个地点    域的完整性:用Check来促成约束,在数据库设计工具中,对字段的取值范围拓展定义时,有2个Check按钮,通 
  过它定义字段的值城。 
  参照完整性:用PK、FK、表级触发器来兑现。 
  用户定义完整性:它是有个别业务规则,用存款和储蓄进程和触发器来完成。 

      14. 升高数据库运转作用的措施 
   
      在加以的系统硬件和种类软件条件下,升高数据库系统的运作成效的法子是: 
       (1) 在数据库物理设计时,下落范式,扩展冗余, 少用触发器, 多用存储进度。 
       
       (2) 当总结相当复杂、而且记录条数格外了不起时(例如一千万条),复杂总计要先在数据库外面,以文件系统格局用C++语言计算处理实现未来,最终才入库追加到表中去。那是邮电通讯计费系统规划的经历。 
   
       (3) 发现有些表的笔录太多,例如超越一千万条,则要对该表进行水平划分。水平划分的做法是,以该表主键PK的某部值为界线,将该表的记录水平划分为八个表。若发现有些表的字段太多,例如抢先77个,则垂直细分该表,将本来的三个表分解为七个表。 
   
       (4) 对数据库管理类别DBMS进行系统优化,即优化种种系统参数,如缓冲区个数。 
   
       (5) 在应用面向数据的SQL语言实行程序设计时,尽量选取优化算法。 
  
      总而言之,要升高数据库的周转作用,必须从数据库系统级优化、数据库设计级优化、程序完成级优化,那一个层次上还要下功夫。

13. 防护数据库设计打补丁的点子是“三少原则”     (1)
1个数据库中表的个数越少越好。唯有表的个数少了,才能证实系统的E–LAND图少而精,去掉了重新的剩余的 
    实体,形成了对创设世界的中度抽象,实行了系统的数量集成,幸免了打补丁式的陈设; 

   (2)
二个表中组合主键的字段个数越少越好。因为主键的效益,一是建主键索引,二是做为子表的外键,所以组 
    合主键的字段个数少了,不仅节省了运转时刻,而且节省了目录存款和储蓄空间; 

   (3)
一个表中的字段个数越少越好。唯有字段的个数少了,才能印证在系统中不设有数据重复,且很少有数量冗 
    余,更珍视的是督促读者学会“列变行”,那样就幸免了将子表中的字段拉入到主表中去,在主表中留下许 
    多空余的字段。所谓“列变行”,正是将主表中的一有的剧情拉出去,其余单独建三个子表。这些主意很简 
    单,有的人正是不习惯、不选择、不进行。 

  数据库设计的实用原则是:在数码冗余和处理速度之间找到适当的平衡点。“三少”是1个总体概念,综合观点, 
  无法孤立某1个准绳。该规则是相对的,不是相对的。“三多”原则肯定是荒唐的。试想:若覆盖种类一样的功 
  能,玖拾四个实体(共壹仟个属性)
的E–Highlander图,肯定比二百个实体(共二千个本性) 的E–Evoque图,要好得多。 

  提倡“三少”原则,是叫读者学会运用数据库设计技术举办系统的数据集成。数据集成的手续是将文件系统集成 
  为使用数据库,将选拔数据库集成为主旨数据库,将大旨数据库集成为全局综合数据库。集成的水平越高,数据 
  共享性就越强,消息孤岛现象就越少,整个公司音信种类的全局E—汉兰达图中实体的个数、主键的个数、属性的个数 
  就会越少。 

  提倡“三少”原则的目标,是防备读者利用打补丁技术,不断地对数据库进行增加和删除改,使集团数据库变成了任性 
  设计数据库表的“垃圾堆”,或数量库表的“大杂院”,最后造成数据库中的基本表、代码表、中间表、一时半刻表 
  一塌糊涂,不可计数,导致企事业单位的消息种类不可能维护而瘫痪。 

  
“三多”原则任何人都能够成功,该标准是“打补丁方法”设计数据库的歪农学说。“三少”原则是少而精的 
  原则,它要求有较高的数据库设计技术与办法,不是任哪个人都能一鼓作气的,因为该规范是杜绝用“打补丁方法” 
  设计数据库的理论根据。 

14. 狠抓数据库运转功用的办法 
  在给定的系统硬件和系统软件条件下,升高数据库系统的运转功用的章程是: 
   (1) 在数据库物理设计时,下跌范式,扩充冗余, 少用触发器,
多用存款和储蓄进程。 
   (2)
当总计分外复杂、而且记录条数分外巨大时(例如1000万条),复杂总计要先在数据库外面,以文件系统方 
    式用C++语言计算处理到位之后,最后才入库追加到表中去。那是邮电通讯计费系统规划的经验。 
   (3)
发现有些表的记录太多,例如抢先一千万条,则要对该表实行水平划分。水平划分的做法是,以该表主键 
    PK的某部值为界线,将该表的记录水平划分为五个表。若发现某些表的字段太多,例如超越捌十二个,则 
    垂直细分该表,将原先的1个表分解为三个表。 
   (4)
对数据库管理种类DBMS举办系统优化,即优化各个系统参数,如缓冲区个数。 
   (5) 在选择面向数据的SQL语言实行程序设计时,尽量使用优化算法。 
    不问可见,要增长数据库的周转功用,必须从数据库系统级优化、数据库设计级优化、程序达成级优化,那三 
    个层次上还要下功夫。 

  上述15个技术,是累累人在大方的数据库分析与规划执行中,稳步总括出来的。对于那几个经历的利用,读者不能够生帮硬套,死记硬背,而要消化明白,实事求是,灵活明白。并逐步做到:在运用中前进,在迈入中央银行使。

转载自:http://www.javaeye.com/topic/281611