即一张原始票据对应且只对应3个实体,就对应四个基本表

http://www.cnblogs.com/guojingyang/archive/2008/11/26/1341406.html

1. 原来票据与实体之间的关系 
   
      能够是极度、一对多、多对多的关系。在一般景色下,它们是一对一的涉嫌:即一张本来票据对应且只对应贰个实体。在万分情状下,它们大概是一对多或多对一的关系,即一张原始单证对应八个实体,或多张本来单证对应3个实体。那里的实业可以清楚为基本表。显然那种对应关系后,对大家统一筹划录入界面大有便宜。 

 

      〖例1〗:一份职员和工人履历资料,在人力财富音讯体系中,就对应八个基本表:职员和工人基本境况表、社会关系表、工作简历表。那就是“一张本来单证对应多少个实体”的天下第2例证。 

1.
本来票据与实体之间的关联  能够是一定、一对多、多对多的关系。在一般景观下,它们是非常的涉嫌:即一张原始票据对应且只对应八个实体。在卓殊情状下,它们也许是一对多或多对一的关系,即一张本来单证对应多少个实体,或多张原始单证对应三个实体。那里的实体能够领略为基本表。显明那种对应关系后,对咱们规划录入界面大有便宜。
〖例1〗:一份职员和工人履历资料,在人力能源音信体系中,就对应几个基本表:职员和工人基本情形表、社会关系表、工作简历表。那便是“一张原始单证对应四个实体”的出人头地例证。

      2. 主键与外键 
   
      一般而言,三个实体不可能既无主键又无外键。在E?逍客 图中, 处于叶子部位的实业, 能够定义主键,也能够不定义主键(因为它无子孙), 但必要求有外键(因为它有老爹)。 
   
      主键与外键的宏图,在全局数据库的宏图中,占有首要地点。当全局数据库的布署性成就现在,有个美利坚合众国数据库设计专家说:“键,四处都以键,除了键之外,什么也不曾”,那正是她的数据库设计经验之谈,也反映了他对新闻系统宗旨(数据模型)的惊人抽象思维。因为:主键是实体的可观抽象,主键与外键的交配,表示实体之间的总是。 

  1. 主键与外键
    相似而言,三个实体不能够既无主键又无外键。在E—凯雷德 图中, 处于叶子部位的实体,
    能够定义主键,也得以不定义主键(因为它无子孙),
    但必须求有外键(因为它有老爸)。主键与外键的安排性,在大局数据库的布署中,占有首要地点。当全局数据库的筹划到位以往,有个美利坚同盟国数据库设计大方说:“键,随处可遇键,除了键之外,什么也远非”,那就是她的数据库设计经验之谈,也反映了他对音讯系统大旨(数据模型)的中度抽象思维。因为:主键是实业的莫斯中国科学技术大学学抽象,主键与外键的杂交,表示实体之间的接连。

  2. 基本表的习性
    基本表与中间表、暂时表分化,因为它兼具如下七个特征:
    (1) 原子性。基本表中的字段是不可再解释的。
    (2) 原始性。基本表中的记录是本来数据(基础数据)的记录。
    (3) 演绎性。由基本表与代码表中的多少,能够派生出富有的输出数据。
    (4) 稳定性。基本表的构造是相对平稳的,表中的记录是要长时间保留的。
    领悟基本表的属性后,在统一筹划数据库时,就能将基本表与中间表、近期表区分开来。

      3. 基本表的习性 
   
      基本表与中间表、临时表分化,因为它拥有如下多个特征: 
    
        (1) 原子性。基本表中的字段是不足再解释的。 
      (2) 原始性。基本表中的记录是固有数据(基础数据)的记录。 
      (3) 演绎性。由基本表与代码表中的数目,能够派生出全数的输出数据。 
      (4) 稳定性。基本表的布局是绝对稳定的,表中的记录是要漫长保留的。 

  1. 范式标准
    基本表及其字段之间的涉嫌,
    应尽量知足第②范式。不过,满意第二范式的数据库设计,往往不是最棒的筹划。为了压实数据库的运营功能,日常须要降低范式标准:适当扩充冗余,达到以空间换时间的目标。
    〖例2〗:有一张存放商品的基本表,如表1所示。“金额”这些字段的留存,申明该表的设计不满足第2范式,因为“金额”能够由“单价”乘以“数量”获得,表明“金额”是冗余字段。但是,扩展“金额”那些冗余字段,能够提升查询计算的快慢,那便是以空间换时间的作法。
    在Rose二〇〇三中,规定列有二种档次:数据列和总括列。“金额”那样的列被喻为“总括列”,而“单价”和“数量”这样的列被叫做“数据列”。
    表1 商品表的表结构
    商品名称 商品型号 单价 数量 金额
    电视机 29吋 2,500 40 100,000
     
  2. 通俗地精通几个范式
    通俗地理解七个范式,对于数据库设计大有益处。在数据库设计中,为了更好地采纳八个范式,就亟须通俗地领悟七个范式(通俗地领悟是够用的掌握,并不是最正确最规范的明亮):
    率先范式:1NF是对质量的原子性约束,须要品质具有原子性,不可再解释;
    其次范式:2NF是对记录的惟一性约束,需要记录有惟一标识,即实体的惟一性;
    其三范式:3NF是对字段冗余性的束缚,即任何字段无法由别的字段派生出来,它须求字段没有冗余。
    并未冗余的数据库设计能够成功。不过,没有冗余的数据库未必是最佳的数据库,有时为了增长运行作效果能,就非得降低范式标准,适当保留冗余数据。具体做法是:在概念数据模型设计时严守第②范式,下跌范式标准的工作置于物理数据模型设计时考虑。降低范式正是扩展字段,允许冗余。

  3. 要善于识别与正确处理多对多的涉嫌
    若四个实体之间存在多对多的关系,则应解除那种关联。消除的点子是,在两者之间扩张第多少个实体。那样,原来一个多对多的涉及,现在成为八个一对多的关联。要将原来三个实体的习性合理地分配到三个实体中去。那里的第三个实体,实质上是二个较复杂的涉及,它对应一张基本表。一般来讲,数据库设计工具不能够辨识多对多的关系,但能处理多对多的关系。
    〖例3〗:在“体育地方新闻种类”中,“图书”是三个实体,“读者”也是贰个实体。那八个实体之间的涉嫌,是1个超人的多对多关系:一本书籍在分歧时间能够被多少个读者借阅,一个读者又有啥不可借多本书籍。为此,要在二者之间扩大第⑤个实体,该实体取名为“借还书”,它的属性为:借还时间、借还标明(0意味着借书,1意味着还书),此外,它还相应有五个外键(“图书”的主键,“读者”的主键),使它能与“图书”和“读者”连接。

  4. 主键PK的取值方法
    PK是供程序员使用的表间连接工具,能够是一无物理意义的数字串,
    由程序自动加1来贯彻。也得以是有物理意义的字段名或字段名的构成。可是前者比后者好。当PK是字段名的组成时,提议字段的个数不要太多,多了非但索引占用空间大,而且速度也慢。

      精晓基本表的性质后,在筹划数据库时,就能将基本表与中间表、一时表区分开来。 

  1. 正确认识数据冗余
    主键与外键在多表中的重复出现,
    不属于数据冗余,那一个概念必须清楚,事实上有诸四个人还不知底。非键字段的再次出现,
    才是数码冗余!而且是一种低级冗余,即重复性的冗余。高级冗余不是字段的重新出现,而是字段的派生出现。
    〖例4〗:商品中的“单价、数量、金额”八个字段,“金额”正是由“单价”乘以“数量”派生出来的,它便是冗余,而且是一种尖端冗余。冗余的目标是为了做实处理速度。唯有初级冗余才会追加数量的不同性,因为同样数据,也许从区别时间、地方、剧中人物上频仍录入。因而,大家倡导高级冗余(派生性冗余),反对低级冗余(重复性冗余)。

  2. E–Murano图没有标准答案
    消息类其他E–CR-V图没有标准答案,因为它的设计与画法不是惟一的,只要它覆盖了系统须求的业务范围和效果内容,正是实用的。反之要修改E–LAND图。就算它从不惟一的标准答案,并不表示能够随便设计。好的E—Enclave图的正经是:结构清晰、关联简洁、实体个数适中、属性分合作理、没有低级冗余。

  3. 视图技术在数据库设计中很有用
    与基本表、代码表、中间表差别,视图是一种虚表,它凭借数据源的实表而存在。视图是供程序员使用数据库的二个窗口,是基表数据汇总的一种情势,
    是数据处理的一种艺术,是用户数量保密的一种手段。为了拓展复杂处理、升高运算速度和节省存款和储蓄空间,
    视图的概念深度一般不足超越三层。 若三层视图仍不够用,
    则应在视图上定义权且表, 在一时表上再定义视图。那样频仍交迭定义,
    视图的深度就不受限制了。
    对于某个与国家政治、经济、技术、军事和安全利益有关的新闻种类,视图的效应更是关键。这个类别的基本表完成物理设计之后,马上在基本表上创制第壹层视图,那层视图的个数和组织,与基本表的个数和组织是完全相同。并且明确,全部的程序员,一律只准在视图上操作。只有数据库管理员,带着多少人口共同精通的“安全钥匙”,才能一向在基本表上操作。请读者思考:那是为啥?

  4. 中间表、报表和一时表
    中等表是存放总计数据的表,它是为数据仓库、输出报表或询问结果而设计的,有时它没有主键与外键(数据仓库除了那么些之外)。一时半刻表是程序员个人布署的,存放方今记录,为个人所用。基表和中间表由DBA维护,权且表由程序员自身用程序自动爱慕。

  5. 完整性约束表今后多个方面
    域的完整性:用Check来兑现约束,在数据库设计工具中,对字段的取值范围举行定义时,有三个Check按钮,通过它定义字段的值城。参照完整性:用PK、FK、表级触发器来促成。用户定义完整性:它是局地事务规则,用存储进度和触发器来兑现。

  6. 避防数据库设计打补丁的法门是“三少原则”
    (1)
    一个数据库中表的个数越少越好。唯有表的个数少了,才能证实系统的E–ENCORE图少而精,去掉了重新的剩余的实体,形成了对合理世界的可观抽象,进行了系统的数码集成,幸免了打补丁式的规划;
    (2)
    多少个表中组合主键的字段个数越少越好。因为主键的法力,一是建主键索引,二是做为子表的外键,所以组合主键的字段个数少了,不仅节省了运行时刻,而且节省了目录存款和储蓄空间;
    (3)
    叁个表中的字段个数越少越好。只有字段的个数少了,才能印证在系统中不存在数据重复,且很少有数据冗余,更关键的是督促读者学会“列变行”,那样就幸免了将子表中的字段拉入到主表中去,在主表中留给不少空暇的字段。所谓“列变行”,正是将主表中的一有个别剧情拉出去,其它单独建一个子表。这一个方法很简短,有的人正是不习惯、不选取、不履行。
    数据库设计的实用原则是:在数码冗余和处理速度之间找到合适的平衡点。“三少”是三个全部概念,综合观点,无法孤立某3个条件。该原则是相对的,不是纯属的。“三多”原则肯定是大错特错的。试想:若覆盖类别一样的机能,玖拾柒个实体(共一千个属性)
    的E–劲客图,肯定比二百个实体(共二千个性情) 的E–中华V图,要好得多。
    提倡“三少”原则,是叫读者学会运用数据库设计技术拓展系统的数额集成。数据集成的步子是将文件系统集成为应用数据库,将运用数据库集成为主旨数据库,将宗旨数据库集成为全局综合数据库。集成的水平越高,数据共享性就越强,音讯孤岛现象就越少,整个公司音讯系列的全局E—Odyssey图中实体的个数、主键的个数、属性的个数就会越少。
    倡导“三少”原则的目标,是防患读者利用打补丁技术,不断地对数据库实行增加和删除改,使公司数据库变成了任性设计数据库表的“垃圾堆”,或数额库表的“大杂院”,最终导致数据库中的基本表、代码表、中间表、近期表杂乱无章,不可胜计,导致企事业单位的音信种类不能够珍视而瘫痪。
    “三多”原则任何人都能够形成,该条件是“打补丁方法”设计数据库的歪历史学说。“三少”原则是少而精的口径,它供给有较高的数据库设计技术与方法,不是任何人都能不辱职责的,因为该规则是杜绝用“打补丁方法”设计数据库的理论依照。

  7. 增强数据库运行作效果能的艺术
    在给定的种类硬件和类别软件条件下,升高数据库系统的运作效能的法子是:
    (1) 在数据库物理设计时,下落范式,增添冗余, 少用触发器, 多用存款和储蓄进程。
    (2)
    当总结非凡复杂、而且记录条数非常巨大时(例如1000万条),复杂计算要先在数据库外面,以文件系统格局用C++语言计算处理到位今后,最终才入库追加到表中去。这是邮电通讯计费系统规划的经验。
    (3)
    发现有些表的记录太多,例如抢先壹仟万条,则要对该表举行水平划分。水平划分的做法是,以该表主键PK的有些值为界线,将该表的笔录水平划分为三个表。若发现有些表的字段太多,例如超过7八个,则垂直细分该表,将原先的二个表分解为八个表。
    (4)
    对数据库管理系列DBMS实行系统优化,即优化种种系统参数,如缓冲区个数。
    (5) 在使用面向数据的SQL语言举行程序设计时,尽量利用优化算法。
    简单的讲,要升高数据库的运营效用,必须从数据库系统级优化、数据库设计级优化、程序完结级优化,那八个层次上还要下武术。

      4. 范式标准 
  
      基本表及其字段之间的关联, 应尽量满意第1范式。可是,满意第叁范式的数据库设计,往往不是最棒的设计。为了增强数据库的运维功用,平日必要下跌范式标准:适当扩大冗余,达到以空间换时间的目标。 

      〖例2〗:有一张存放商品的基本表,如表1所示。“金额”这么些字段的存在,表明该表的筹划不满足第壹范式,因为“金额”能够由“单价”乘以“数量”获得,说明“金额”是冗余字段。可是,增加“金额”这些冗余字段,能够升高查询总结的快慢,那就是以空间换时间的作法。 
   
      在罗丝 二零零四中,规定列有两体系型:数据列和计算列。“金额”那样的列被称呼“总括列”,而“单价”和“数量”那样的列被称之为“数据列”。 
   
      表1 商品表的表结构 
    商品名称 商品型号 单价 数量 金额 
    电视机 29? 2,500 40 100,000 
    
      5. 伊始地精晓多少个范式 
   
      通俗地领略多个范式,对于数据库设计大有便宜。在数据库设计中,为了更好地运用八个范式,就务须通俗地明白多少个范式(通俗地精晓是够用的驾驭,并不是最科学最标准的知晓): 
   
      第三范式:1NF是对质量的原子性约束,需要品质具有原子性,不可再解释; 
    第一范式:2NF是对记录的惟一性约束,供给记录有惟一标识,即实体的惟一性; 
    第贰范式:3NF是对字段冗余性的约束,即任何字段无法由别的字段派生出来,它须求字段没有冗余. 
   
      没有冗余的数据库设计能够做到。不过,没有冗余的数据库未必是最棒的数据库,有时为了压实运营作用,就必须降低范式标准,适当保留冗余数据。具体做法是:在概念数据模型设计时坚守第3范式,下跌范式标准的工作置于物理数据模型设计时考虑。下跌范式就是扩展字段,允许冗余。 

      6. 要善于识别与正确处理多对多的关联 
       
      若三个实体之间存在多对多的涉及,则应革除那种关涉。化解的措施是,在两者之间扩展第多少个实体。那样,原来2个多对多的涉嫌,将来改成三个一对多的涉及。要将本来多个实体的质量合理地分配到四个实体中去。那里的第三个实体,实质上是3个较复杂的关系,它对应一张基本表。一般来讲,数据库设计工具不能够鉴定识别多对多的涉及,但能处理多对多的关联。 

      〖例3〗:在“教室新闻种类”中,“图书”是3个实体,“读者”也是贰个实体。那八个实体之间的关联,是2个优秀的多对多涉及:一本书籍在差异时间足以被七个读者借阅,2个读者又有啥不可借多本书籍。为此,要在二者之间扩展第一个实体,该实体取名为“借还书”,它的性质为:借还时间、借还标明(0表示借书,1象征还书),其它,它还应有有八个外键(“图书”的主键,“读者”的主键),使它能与“图书”和“读者”连接。 

      7. 主键PK的取值方法 
    
      PK是供程序员使用的表间连接工具,可以是一无物理意义的数字串, 由程序自动加1来达成。也得以是有大体意义的字段名或字段名的构成。不过前者比后者好。当PK是字段名的组成时,提出字段的个数不要太多,多了不但索引占用空间大,而且速度也慢。 

      8. 正确认识数据冗余 
   
      主键与外键在多表中的重复出现, 不属于数据冗余,那几个概念必须精晓,事实上有更仆难数人还不清楚。非键字段的双重出现, 才是数量冗余!而且是一种低级冗余,即重复性的冗余。高级冗余不是字段的重现,而是字段的派生出现。 

      〖例4〗:商品中的“单价、数量、金额”多少个字段,“金额”正是由“单价”乘以“数量”派生出来的,它正是冗余,而且是一种尖端冗余。冗余的指标是为着增强处理速度。唯有初级冗余才会扩张数量的分裂性,因为相同数据,恐怕从区别时间、地方、角色上翻来覆去录入。由此,大家倡导高级冗余(派生性冗余),反对低级冗余(重复性冗余)。 

      9. E–哈弗图没有标准答案 
   
      音讯体系的E–路虎极光图没有标准答案,因为它的筹划与画法不是绝无仅有的,只要它覆盖了系统须求的业务范围和效果内容,正是行得通的。反之要修改E–Lacrosse图。即使它没有惟一的标准答案,并不表示能够肆意设计。好的E?昂科威图的规范是:结构清晰、关联简洁、实体个数适中、属性分同盟理、没有低级冗余。 

      10. 视图技术在数据库设计中很有用 
   
      与基本表、代码表、中间表分歧,视图是一种虚表,它依靠数据源的实表而存在。视图是供程序员使用数据库的三个窗口,是基表数据汇总的一种形式, 是数据处理的一种艺术,是用户数量保密的一种手段。为了拓展复杂处理、进步运算速度和节省存款和储蓄空间, 视图的概念深度一般不足超越三层。 若三层视图仍不够用, 则应在视图上定义临时表, 在权且表上再定义视图。那样往往交迭定义, 视图的深度就不受限制了。 

      对于有些与国家政治、经济、技术、军事和平安利益有关的音讯种类,视图的功用更是关键。那几个种类的基本表达成物理设计之后,马上在基本表上建立第1层视图,这层视图的个数和协会,与基本表的个数和布局是完全相同。并且规定,全体的程序员,一律只准在视图上操作。唯有数据库管理员,带着多个人口共同精晓的“安全钥匙”,才能向来在基本表上操作。请读者思考:那是干什么? 

      11. 中间表、报表和暂且表 
   
      中间表是存放总计数据的表,它是为数据仓库、输出报表或询问结果而规划的,有时它从不主键与外键(数据仓库除此之外)。权且表是程序员个人安排的,存放方今记录,为私家所用。基表和中间表由DBA维护,权且表由程序员本人用程序自动爱护。 

      12. 完整性约束表今后多少个方面 
   
      域的完整性:用Check来促成约束,在数据库设计工具中,对字段的取值范围实行定义时,有三个Check按钮,通过它定义字段的值城。参照完整性:用PK、FK、表级触发器来贯彻。用户定义完整性:它是有的事务规则,用存款和储蓄进程和触发器来促成。 

      13. 防护数据库设计打补丁的不二法门是“三少原则” 
    
       (1) 2个数据库中表的个数越少越好。只有表的个数少了,才能表明系统的E–CRUISER图少而精,去掉了重复的多余的实体,形成了对客观世界的冲天抽象,举办了系统的数额集成,幸免了打补丁式的设计; 
     
       (2) 三个表中组合主键的字段个数越少越好。因为主键的功能,一是建主键索引,二是做为子表的外键,所以组合主键的字段个数少了,不仅节省了运营时刻,而且节省了目录存款和储蓄空间; 
     
       (3) 五个表中的字段个数越少越好。唯有字段的个数少了,才能印证在系统中不存在数量再度,且很少有多少冗余,更首要的是督促读者学会“列变行”,这样就防止了将子表中的字段拉入到主表中去,在主表中留下不少空余的字段。所谓“列变行”,便是将主表中的一有个别剧情拉出去,此外单独建一个子表。那些主意很简单,有的人正是不习惯、不接纳、不履行。 
   
      数据库设计的实用原则是:在数码冗余和处理速度之间找到合适的平衡点。“三少”是一个全体概念,综合观点,不可能孤立某3个标准。该标准是对峙的,不是纯属的。“三多”原则肯定是大错特错的。试想:若覆盖种类一样的效应,九1几个实体(共1000个性格) 的E–ENVISION图,肯定比二百个实体(共二千个属性) 的E–PAJERO图,要好得多。 
   
      提倡“三少”原则,是叫读者学会使用数据库设计技术拓展系统的数据集成。数据集成的步骤是将文件系统集成为应用数据库,将使用数据库集成为核心数据库,将核心数据库集成为全局综合数据库。集成的程度越高,数据共享性就越强,音讯孤岛现象就越少,整个集团信息体系的全局E?Enclave图中实体的个数、主键的个数、属性的个数就会越少。 
   
      提倡“三少”原则的目标,是严防读者利用打补丁技术,不断地对数据库实行增加和删除改,使集团数据库变成了随便设计数据库表的“垃圾堆”,或数额库表的“大杂院”,最终导致数据库中的基本表、代码表、中间表、暂时表一无可取,不可胜言,导致企事业单位的新闻种类不恐怕保险而瘫痪。 
    
      “三多”原则任哪个人都得以成功,该标准是“打补丁方法”设计数据库的歪经济学说。“三少”原则是少而精的规则,它须求有较高的数据库设计技术与措施,不是任何人都能成就的,因为该条件是杜绝用“打补丁方法”设计数据库的理论根据。 

      14. 提升数据库运维功能的章程 
   
      在加以的系统硬件和系统软件条件下,提升数据库系统的运转功用的方法是: 
       (1) 在数据库物理设计时,下跌范式,扩充冗余, 少用触发器, 多用存储进程。 
       
       (2) 当总括十分复杂、而且记录条数非凡伟大时(例如1000万条),复杂总括要先在数据库外面,以文件系统格局用C++语言总括处理到位之后,最终才入库追加到表中去。那是邮电通信计费系统规划的经验。 
   
       (3) 发现某些表的记录太多,例如超越一千万条,则要对该表举办水平划分。水平划分的做法是,以该表主键PK的有个别值为界线,将该表的笔录水平划分为四个表。若发现某些表的字段太多,例如超越75个,则垂直细分该表,将原先的二个表分解为八个表。 
   
       (4) 对数据库管理种类DBMS实行系统优化,即优化各个系统参数,如缓冲区个数。 
   
       (5) 在使用面向数据的SQL语言进行程序设计时,尽量选用优化算法。 
  
      总而言之,要进步数据库的运作作用,必须从数据库系统级优化、数据库设计级优化、程序达成级优化,那四个层次上还要下武功。