Presentation is loading. Please wait.

Presentation is loading. Please wait.

An Introduction to Database System

Similar presentations


Presentation on theme: "An Introduction to Database System"— Presentation transcript:

1 An Introduction to Database System
数据库系统概论 An Introduction to Database System 第六章 关系数据理论 教师: 陈红 助教: 王琪 于秀梅

2 联系方式 陈红 王琪 chong@ruc.edu.cn 电话: 62513914 办公室: 理工配楼301A
于秀梅 理工配楼301 Tel:

3 第一篇 基础篇 本篇讲解数据库系统的基本概念和基础知识 第一章 绪论 初步讲解数据库的基本概念 第二章 关系数据库 系统讲解关系数据库的重要概念 第三章 关系数据库标准语言SQL 第四章 数据库安全性 第五章 数据库完整性

4 第二篇 设计与应用开发篇 应用系统开发过程中: 如何基于某个数据库管理系统设计数据库, 如何基于数据库系统编程 第六章 关系数据理论 第七章 数据库设计 第八章 数据库编程 课程大作业:数据库设计与应用开发

5 第六章 关系数据理论 问题的提出 关系数据库的基本概念 关系模型 关系数据库的标准语言 关系数据库逻辑设计
针对一个具体问题,应如何构造一个适合于它的数据模式,即应该构造几个关系,每个关系由哪些属性组成等。 数据库逻辑设计的工具──关系数据库的规范化理论

6 第六章 关系数据理论 6.1 数据依赖 6.2 规范化 6.3 数据依赖的公理系统 6.4 模式的分解

7 第六章 关系数据理论 6.1 数据依赖 6.2 规范化 6.3 数据依赖的公理系统 6.4 模式的分解

8 6.1 数据依赖 内容提要 什么是数据依赖 数据依赖对关系模式有什么影响 数据依赖的形式化定义

9 6.1 数据依赖 6.1.1 关系模式中的数据依赖 6.1.2 数据依赖对关系模式的影响 6.1.3 有关概念

10 6.1 数据依赖 6.1.1 关系模式中的数据依赖 6.1.2 数据依赖对关系模式的影响 6.1.3 有关概念

11 6.1.1 关系模式中的数据依赖 一、概念回顾 二、关系模式的形式化定义 三、什么是数据依赖 四、关系模式的简化表示

12 一、概念回顾 关系:描述实体及其属性、实体间的联系。 从形式上看,它是一张二维表,是所涉及属性的笛卡尔积的一个子集。
关系模式:用来定义关系。 关系数据库:基于关系模型的数据库,利用关系来描述现实世界。 从形式上看,它由一组关系组成。 关系数据库的模式:定义这组关系的关系模式的全体。

13 二、关系模式的形式化定义 关系模式由五部分组成,即它是一个五元组: R(U, D, DOM, F) U: 组成该关系的属性名集合
D: 属性组U中属性所来自的域 DOM:属性向域的映象集合 F: 属性间数据的依赖关系集合。即限定 了组成关系的各个元组必须满足的完 整性约束条件。

14 三、什么是数据依赖 1. 完整性约束的表现形式 限定属性取值范围:例如学生成绩必须在0-100之间
定义属性值间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键。

15 什么是数据依赖(续) 2. 数据依赖 是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系 是现实世界属性间相互联系的抽象
是数据内在的性质 是语义的体现

16 什么是数据依赖(续) 3. 数据依赖的主要类型 函数依赖(Functional Dependency,简记为FD)
多值依赖(Multivalued Dependency,简记为MVD) 连接依赖

17 四、关系模式的简化表示 在关系模式R(U, D, DOM, F)中,影响数据库模式设计的主要是U和F,D和DOM对其影响不大,为了方便讨论,我们将关系模式简化为一个三元组: R(U, F) 当且仅当U上的一个关系r满足F时,r称为关系模式R(U, F)的一个关系。

18 6.1 数据依赖 6.1.1 关系模式中的数据依赖 6.1.2 数据依赖对关系模式的影响 6.1.3 有关概念

19 6.1.2 数据依赖对关系模式的影响 例:建立一个描述学校的数据库。 涉及的对象包括: 学生的学号(Sno) 所在系(Sdept)
系主任姓名(Mname) 课程名(Cname) 成绩(Grade)

20 数据依赖对关系模式的影响(续) 假设学校的数据库模式由一个单一的关系模式Student构成, 则该关系模式的属性集合为:
  U ={ Sno, Sdept, Mname, Cname, Grade }

21 数据依赖对关系模式的影响(续) 现实世界的已知事实告诉我们: ⒈ 一个系有若干学生, 但一个学生只属于一个系; ⒉ 一个系只有一名主任;
⒈ 一个系有若干学生, 但一个学生只属于一个系; ⒉ 一个系只有一名主任; ⒊ 一个学生可以选修多门课程, 每门课程有若干学生选修; ⒋ 每个学生所学的每门课程都有一个成绩。

22 数据依赖对关系模式的影响(续) 由此可得到属性组U上的一组函数依赖F: F ={ Sno → Sdept, Sdept → Mname,
(Sno, Cname) → Grade } Sno Cname Sdept Mname Grade

23 数据依赖对关系模式的影响(续) 关系模式Student<U, F>中存在的问题: ⒈ 数据冗余太大 浪费大量的存储空间
例:每一个系主任的姓名重复出现,重复次数与该系所有学生的所有课程成绩出现次数相同。

24 数据依赖对关系模式的影响(续) ⒉ 更新异常(Update Anomalies) 数据冗余 ,更新数据时,维护数据完整性代价大。
例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组。

25 数据依赖对关系模式的影响(续) ⒊ 插入异常(Insertion Anomalies) 该插的数据插不进去
例,如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。

26 数据依赖对关系模式的影响(续) ⒋ 删除异常(Deletion Anomalies) 不该删除的数据不得不删
例,如果某个系的学生全部毕业了, 我们在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。

27 原因:由存在于模式中的某些数据依赖引起的。
数据依赖对关系模式的影响(续) 结论:Student关系模式不是一个好的模式。 一个“好”的模式应当不会发生插入异常、删除异常,更新异常、数据冗余应尽可能少。 原因:由存在于模式中的某些数据依赖引起的。 解决方法:通过分解关系模式来消除其中不合适 的数据依赖。

28 数据依赖对关系模式的影响(续) 规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。

29 6.1 数据依赖 6.1.1 关系模式中的数据依赖 6.1.2 数据依赖对关系模式的影响 6.1.3 有关概念

30 6.1.3 有关概念 一、函数依赖 二、平凡函数依赖与非平凡函数依赖 三、完全函数依赖与部分函数依赖 四、传递函数依赖 五、码

31 一、函数依赖 定义6.1 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。 X称为这个函数依赖的决定属性集(Determinant)。

32 函数依赖(续) 例: Student(Sno, Sname, Ssex, Sage, Sdept) 假设不允许重名,则有:
Sno → Ssex, Sno → Sage Sno → Sdept, Sno ←→ Sname Sname → Ssex, Sname → Sage Sname → Sdept 但Ssex →Sage, Ssex →Sdept,

33 错误的Student表 Sno Sname Ssex Sage Sdept 张三 男 20 计算机系 李四 女 21 自动化系 S3 王五
赵六 S5 田七 .

34 函数依赖(续) 说明: 1. 函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。
2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。 例如“姓名→年龄”这个函数依赖只有在不允许有同名人的条件下成立

35 函数依赖(续) 3. 数据库设计者可以对现实世界作强制的规定。例如设计者可以强行规定不允许同名人出现,因而使函数依赖“姓名→年龄”成立。但所插入的元组必须满足规定的函数依赖,若发现有同名人存在, 则拒绝装入该元组。 4. 若X→Y,并且Y→X, 则记为X←→Y。 5. 若Y不函数依赖于X, 则记为X─→Y。

36 二、平凡函数依赖与非平凡函数依赖 定义6.2 在关系模式R(U)中,对于U的子集X和Y,如果X→Y,但Y  X,则称X→Y是非平凡的函数依赖。若X→Y,但Y  X则称X→Y是平凡的函数依赖。 例:在关系SC(Sno, Cno, Grade)中, 非平凡函数依赖: (Sno, Cno) → Grade 平凡函数依赖: (Sno, Cno) → Sno (Sno, Cno) → Cno

37 平凡函数依赖与非平凡函数依赖(续) 对于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明, 我们总是讨论非平凡函数依赖。

38 三、完全函数依赖与部分函数依赖 定义6.3 在关系模式R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有
X’ Y, 则称Y完全函数依赖于X,记作X f Y。若X→Y,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作 X P Y。

39 完全函数依赖与部分函数依赖(续) 例: 在关系SC(Sno, Cno, Grade)中,有:
由于:Sno →Grade,Cno → Grade, 因此:(Sno, Cno) f Grade 但: (Sno, Cno) P Sno, (Sno, Cno) P Cno

40 完全函数依赖与部分函数依赖(续) 平凡函数依赖或者是形如X→X的依赖, 或者是部分函数依赖 非平凡函数依赖也可能是部分函数依赖
例: Student(Sno, Sname, Ssex, Sage, Sdept) Sno f Sname, Sno f Ssex, Sno f Sage, Sno f Sdept (Sno, Sname) P Sdept, (Sno, Ssex) P Sdept

41 四、传递函数依赖 定义6.4 在关系模式R(U)中,如果X→Y,Y→Z,且Y X,Y→X,则称Z传递函数依赖于X。
注: 如果Y→X, 即X←→Y,则Z直接依赖于X。 例: 在关系Std(Sno, Sdept, Mname)中,有: Sno → Sdept,Sdept → Mname,Mname传递函数依赖于Sno。

42 五、码 定义6.5 设K为关系模式R<U,F>中的属性或属性组合。若KfU,则K称为R的一个候选码(Candidate Key)。若关系模式R有多个候选码,则选定其中的一个做为主码(Primary key)。 2.1.1: 若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码.

43 码(续) 主属性与非主属性 包含在任何一个候选码中的属性 ,称为主属性(Prime attribute)
不包含在任何码中的属性称为非主属性(Nonprime attribute)或非码属性(Non-key attribute) 全码:整个属性组是码,称为全码(All-key)

44 码(续) 已知关系模式R<U,F>, U = {A,B,C,D,E,G} F = {AC→B,CB→D,A→BE,E→GC}
请验证,关系R是否满足函数依赖C→DH? 为什么? C D H S C1 D1 H1 S1 C1 D1 H2 S1 C1 D1 H1 S2 C2 D2 H2 S3

45 码(续) [例2] 关系模式S(Sno,Sdept,Sage),单个属性Sno是码,
SC(Sno,Cno,Grade)中,(Sno,Cno)是码 [例3] 关系模式R(P,W,A) P:演奏者 W:作品 A:听众 一个演奏者可以演奏多个作品 某一作品可被多个演奏者演奏 听众可以欣赏不同演奏者的不同作品 码为(P,W,A),即All-Key

46 外部码 定义6.5 关系模式 R 中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign key)也称外码 如在SC(Sno,Cno,Grade)中,Sno不是码,但Sno是关系模式S(Sno,Sdept,Sage)的码,则Sno是关系模式SC的外部码 主码与外部码一起提供了表示关系间联系的手段

47 第六章 关系数据理论 6.1 数据依赖 6.2 规范化 6.3 数据依赖的公理系统 6.4 模式的分解

48 6.2 规范化 6.2.1 第一范式(1NF) 6.2.2 第二范式(2NF) 6.2.3 第三范式(3NF)
6.2.4 BC范式(BCNF) 6.2.5 多值依赖与第四范式(4NF) 6.2.6 规范化

49 6.2 规范化 范式是符合某一种级别的关系模式的集合。 关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。 范式的种类:
第一范式(1NF) 第二范式(2NF) 第三范式(3NF) BC范式(BCNF) 第四范式(4NF) 第五范式(5NF)

50 规范化(续) 各种范式之间存在联系: 某一关系模式R为第n范式,可简记为R∈nNF。

51 6.2 规范化 6.2.1 第一范式(1NF) 6.2.2 第二范式(2NF) 6.2.3 第三范式(3NF)
6.2.4 BC范式(BCNF) 6.2.5 多值依赖与第四范式(4NF) 6.2.6 规范化

52 6.2.1 第一范式(1NF) 1NF的定义 定义6.6 如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。
第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。 但是满足第一范式的关系模式并不一定是一个好的关系模式。

53 第一范式(续) 例: 关系模式 SLC(Sno, Sdept, Sloc, Cno, Grade)
函数依赖包括: (Sno, Cno) f Grade Sno → Sdept (Sno, Cno) P Sdept Sno → Sloc (Sno, Cno) P Sloc Sdept → Sloc

54 第一范式(续) SLC的码为(Sno, Cno) Sno Cno Grade Sdept Sloc SLC

55 第一范式(续) 结论: SLC存在的问题 1. SLC满足第一范式。
2. 非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno)。 SLC存在的问题 (1) 插入异常 假设Sno=95102,Sdept=IS,Sloc=N的学生还未选课,因课程号是主属性,因此该学生的信息无法插入SLC。

56 第一范式(续) (2) 删除异常 假定某个学生本来只选修了3号课程这一门课。现在因身体不适,他连3号课程也不选修了。因课程号是主属性,此操作将导致该学生信息的整个元组都要删除。 (3) 数据冗余度大 如果一个学生选修了10门课程,那么他的Sdept和Sloc值就要重复存储了10次。

57 第一范式(续) (4) 修改复杂 例如学生转系,在修改此学生元组的Sdept值的同时,还可能需要修改住处(Sloc)。如果这个学生选修了K门课,则必须无遗漏地修改K个元组中全部Sdept、Sloc信息。 因此SLC不是一个好的关系模式。

58 第一范式(续) 原因 Sdept、 Sloc部分函数依赖于码。 解决方法
采用投影分解法,把SLC分解为两个关系模式,以消除这些部分函数依赖。 SC(Sno, Cno, Grade) SL(Sno, Sdept, Sloc)

59 第一范式(续) SLC的码为(Sno, Cno) Sno Cno Grade Sdept Sloc SLC

60 第一范式(续) 函数依赖图: SL Sno Sdept Sloc Sno Cno Grade SC

61 第一范式(续) 在SC和SL中,非主属性都完全函数依赖于码了。从而使上述四个问题在一定程度上得到了一定的解决:

62 第一范式(续) (2) 删除一个学生的所有选课记录,只是SC关系 中没有关于该学生的记录了,SL关系中关于该 学生的记录不受影响。
(3) 不论一个学生选多少门课程,他的Sdept和 Sloc值都只存储1次。这就大大降低了数据冗余。 (4) 学生转系只需修改SL关系中该学生元组的 Sdept值和Sloc值,由于Sdept、 Sloc并未重复 存储,因此减化了修改操作。

63 6.2 规范化 6.2.1 第一范式(1NF) 6.2.2 第二范式(2NF) 6.2.3 第三范式(3NF)
6.2.4 BC范式(BCNF) 6.2.5 多值依赖与第四范式(4NF) 6.2.6 规范化

64 6.2.2 第二范式(2NF) 2NF的定义 定义6.7 若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。
例:SLC(Sno, Sdept, Sloc, Cno, Grade) ∈1NF SC(Sno, Cno, Grade) ∈ 2NF SL(Sno, Sdept, Sloc) ∈ 2NF

65 第二范式(续) 采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。

66 第二范式(续) 函数依赖: 例:2NF关系模式SL(Sno, Sdept, Sloc)中 Sno→Sdept Sdept→Sloc
Sno→Sloc SL Sno Sdept Sloc Sloc传递函数依赖于Sno,即SL中存在非主属性对码的传递函数依赖。

67 第二范式(续) SL关系存在的问题: (1) 插入异常
 (1) 插入异常 如果某个系因种种原因(例如刚刚成立),目前暂时没有在校学生,我们就无法把这个系的信息存入数据库。  (2) 删除异常 如果某个系的学生全部毕业了,我们在删除该系学生信息的同时,把这个系的信息也丢掉了。

68 第二范式(续) (3) 数据冗余度大 每一个系的学生都住在同一个地方,关于系的住处的信息却重复出现,重复次数与该系学生人数相同。
(4) 修改复杂 当学校调整学生住处时,由于关于每个系的住处信息是重复存储的,修改时必须同时更新该系所有学生的Sloc属性值。 所以SL仍不是一个好的关系模式。

69 第二范式(续) SL Sdept 原因 Sno 解决方法 Sloc Sloc传递函数依赖于Sno
SD(Sno, Sdept) DL(Sdept, Sloc) SD的码为Sno, DL的码为Sdept。

70 第二范式(续) SD的码为Sno, DL的码为Sdept。 Sno Sdept SD Sloc DL

71 第二范式(续) 在分解后的关系模式中既没有非主属性对码的部分函数依赖也没有非主属性对码的传递函数依赖,在一定程度上解决了上述四个问题:
(1) DL关系中可以插入无在校学生的系的信息。 (2) 某个系的学生全部毕业了,只是删除SD关系中的相应元组,DL关系中关于该系的信息仍存在。 (3) 关于系的住处的信息只在DL关系中存储一次。 (4) 当学校调整某个系的学生住处时,只需修改DL关系中一个相应元组的Sloc属性值。

72 6.2 规范化 6.2.1 第一范式(1NF) 6.2.2 第二范式(2NF) 6.2.3 第三范式(3NF)
6.2.4 BC范式(BCNF) 6.2.5 多值依赖与第四范式(4NF) 6.2.6 规范化

73 6.2.3 第三范式(3NF) 3NF的定义 定义6.8 关系模式R<U,F> 中若不存在这样的码X、属性组Y及非主属性Z(Z  Y), 使得X→Y,Y → X,Y→Z,成立,则称R<U,F> ∈ 3NF。 例, SL(Sno, Sdept, Sloc) ∈ 2NF SD(Sno, Sdept) ∈ 3NF DL(Sdept, Sloc)∈ 3NF 学生(学号,姓名,宿舍楼,宿舍号)∈ 3NF

74 第三范式(续) 如果R∈3NF,则R也是2NF。 若R∈3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。
采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个2NF关系分解为多个3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余。

75 第三范式(续) 例:在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。 函数依赖:
假设每一教师只教一门课。每门课由若干教师教,但某一学生选定某门课,就确定了一个固定的教师。某个学生选修某个教师的课就确定了所选课的名称。于是有: (S,J)→T,(S,T)→J,T→J

76 第三范式(续) S J T STJ

77 第三范式(续) (S,J)和(S,T)都可以作为候选码。 STJ∈3NF
STJ∈3NF T→J,即T是决定属性集,可是T只是主属性,它既不是候选码,也不包含候选码。

78 第三范式(续) 存在的问题: (1) 插入异常 如果某个教师开设了某门课程,但尚未有学生选修,则有关信息也无法存入数据库中。

79 第三范式(续) (2) 删除异常 如果选修过某门课程的学生全部毕业了,在删除这些学生元组的同时,相应教师开设该门课程的信息也同时丢掉了。
(3) 数据冗余度大 虽然一个教师只教一门课,但每个选修该教师该门课程的学生元组都要记录这一信息。

80 第三范式(续) (4) 修改复杂 某个教师开设的某门课程改名后,所有选修了该教师该门课程的学生元组都要进行相应修改。
因此虽然STJ∈3NF,但它仍不是一个理想的关系模式。

81 第三范式(续) 原因: 主属性J依赖于T,即主属性J部分依赖于码(S, T)。 解决方法: 采用投影分解法,将STJ分解为二个关系模式:
SJ(S,J) TJ(T,J)

82 第三范式(续) S J T STJ

83 第三范式(续) SJ的码为(S,J),TJ的码为T。 S J ST T TJ

84 第三范式(续) 在分解后的关系模式中没有任何属性对码的部分函数依赖和传递函数依赖。它解决了上述四个问题:
(1)TJ关系中可以存储所开课程尚未有学生选修的教师信息。 (2) 选修过某门课程的学生全部毕业了,只是删除SJ关系中的相应元组,不会影响TJ关系中相应教师开设该门课程的信息。

85 第三范式(续) (3) 关于每个教师开设课程的信息只在TJ关系中存储一次。

86 6.2 规范化 6.2.1 第一范式(1NF) 6.2.2 第二范式(2NF) 6.2.3 第三范式(3NF)
6.2.4 BC范式(BCNF) 6.2.5 多值依赖与第四范式(4NF) 6.2.6 规范化

87 6.2.4 BC范式(BCNF) BCNF(Boyce Codd Normal Form)是由Boyce和Codd提出的,比3NF更进了一步。通常认为BCNF是修正的第三范式,所以有时也称为第三范式。 BCNF的定义 定义6.9 设关系模式R<U,F>∈1NF,如果对于R的每个函数依赖X→Y,若Y不属于X,则X必含有候选码,那么R∈BCNF。

88 BC范式(续) 换句话说,在关系模式R<U,F>中,如果每一个决定属性集都包含候选码,则R∈BCNF。
例: STJ(S,T,J)∈ 3NF SJ(S,J)∈ BCNF TJ(T,J)∈ BCNF

89 BC范式(续) 采用投影分解法将一个3NF的关系分解为多个BCNF的关系,可以进一步解决原3NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 BCNF的关系模式所具有的性质 ⒈ 所有非主属性都完全函数依赖于每个候选码。 ⒉ 所有主属性都完全函数依赖于每个不包含它的候选码。 ⒊ 没有任何属性完全函数依赖于非码的任何一组属性。

90 BC范式(续) 如果关系模式R∈BCNF,必定有R∈3NF。

91 6.2 规范化 6.2.1 第一范式(1NF) 6.2.2 第二范式(2NF) 6.2.3 第三范式(3NF)
6.2.4 BC范式(BCNF) 6.2.5 多值依赖与第四范式(4NF) 6.2.6 规范化

92 6.2.5 多值依赖与第四范式(4NF) 例子 一、多值依赖 二、第四范式(4NF)

93 多值依赖与第四范式(续) 例子 属于BCNF的关系模式: 函数依赖: 一个完美的关系模式 多值依赖:
例: 设学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。 用关系模式Teaching(C, T, B)来表示课程C、教师T和参考书B之间的关系。

94 多值依赖与第四范式(续) 表6.1 教 员 T 参 考 书 B 课 程 C 李 勇 物理 王 军 数学 计算数学 … … … 光学原理
物理 数学 计算数学 李 勇 王 军 张 平 周 峰 普通物理学 光学原理 物理习题集 数学分析 微分方程 高等代数

95 多值依赖与第四范式(续) 参考书B 教员T 课程C 用二维表表示:表6.2 Teaching 普通物理学 光学原理 物理习题集 数学分析
微分方程 高等代数 李 勇 王 军 张 平 物 理 数 学 参考书B 教员T 课程C

96 多值依赖与第四范式(续) Teaching∈BCNF: Teach具有唯一候选码(C,T,B), 即全码。 Teaching模式中存在的问题
(1)数据冗余度大:有多少名任课教师,参考书就要存储多少次。

97 多值依赖与第四范式(续) (物理,刘关,普通物理学), Teaching模式中存在的问题 例如物理课增加一名教师刘关,需要插入两个元组:
(2)增加操作复杂:当某一课程增加一名任课教师时,该课程有多少本参照书,就必须插入多少个元组。 例如物理课增加一名教师刘关,需要插入两个元组: (物理,刘关,普通物理学), (物理,刘关,光学原理)

98 多值依赖与第四范式(续) Teaching模式中存在的问题
(3)删除操作复杂:某一门课要去掉一本参考书,该课程有多少名教师,就必须删除多少个元组。 (4)修改操作复杂:某一门课要修改一本参考书,该课程有多少名教师,就必须修改多少个元组。 产生原因 参考书的取值和教师的取值是彼此独立毫无关系的,都只取决于课程名。

99 一、多值依赖 定义 定义6.10 设R(U)是属性集U上的一个关系模式, X、Y和Z是U的子集,并且Z=U-X-Y,多值依赖X→→Y成立当且仅当对R的任一关系r,r在(X,Z)上的每个值对应一组Y的值,这组值仅仅决定于X值而与Z值无关。 例 Teaching(C,T,B)

100 多值依赖(续) 平凡多值依赖和非平凡的多值依赖 若X→→Y,而Z=φ,则称 X→→Y为平凡的多值依赖。 否则称X→→Y为非平凡的多值依赖。

101 多值依赖(续) 多值依赖的性质 (1)多值依赖具有对称性。 若X→→Y,则X→→Z,其中Z=U-X-Y
多值依赖的对称性可以用完全二分图直观地表示出来。 (2)多值依赖具有传递性。 若X→→Y,Y→→Z, 则X→→Z -Y。

102 多值依赖的对称性 Xi Zi1 Zi2 … Zim Yi1 Yi2 … Yin

103 多值依赖的对称性 普通物理学 光学原理 物理习题集 李勇 王军

104 多值依赖(续) (3)函数依赖是多值依赖的特殊情况。 若X→Y,则X→→Y。 (4)若X→→Y,X→→Z,则X→→Y Z。
(6)若X→→Y,X→→Z,则X→→Y-Z, X→→Z -Y。

105 多值依赖(续) 多值依赖与函数依赖的区别 (1) 有效性 多值依赖的有效性与属性集的范围有关。
若X→→Y在U上成立,则在W(X Y  W  U)上一定成立;反之则不然,即X→→Y在W(W  U)上成立,在U上并不一定成立。 原因:多值依赖的定义中不仅涉及属性组X和Y,而且涉及U中其余属性Z。 一般地,在R(U)上若有X→→Y在W(W  U)上成立,则称X→→Y为R(U)的嵌入型多值依赖。

106 多值依赖(续) 函数依赖X→Y的有效性仅决定于X、Y这两个属性集的值
只要在R(U)的任何一个关系r中,元组在X和Y上的值满足定义6.l,则函数依赖X→Y在任何属性集W(X Y  W U)上成立。

107 多值依赖(续) (2) 若函数依赖X→Y在R (U)上成立,则对于任何Y'  Y均有X→Y' 成立。

108 二、第四范式(4NF) 定义 定义6.11 关系模式R<U,F>∈1NF,如果对于R的每个非平凡多值依赖X→→Y(Y  X),X都含有候选码,则R∈4NF。 4NF就是限制关系模式的属性之间不允许有非平凡且非函数依赖的多值依赖。4NF所允许的非平凡多值依赖实际上是函数依赖。

109 第四范式(续) 如果一个关系模式是4NF, 则必为BCNF。

110 第四范式(续) 例: Teach(C,T,B) 由于Teach(C,T,B) 中存在非平凡的多值依赖C→→T,且C不是候选码,因此Teach不属于4NF。 这正是它之所以存在数据冗余度大,插入和删除操作复杂等弊病的根源。

111 第四范式(续) 解决方法 用投影分解法把Teach分解为如下两个4NF关系模式: CT(C, T) CB(C, B)
CT∈4NF。C→→T是平凡多值依赖 CT中不存在既非平凡也非函数依赖的多值依赖。 CB∈4NF。

112 第四范式(续) (1) 参考书只需要在CB关系中存储一次。 分解后Teach关系中的几个问题可以得到解决:
 (2) 当某一课程增加一名任课教师时,只需要在CT关系中增加一个元组。  (3) 某一门课要去掉一本参考书,只需要在CB关系中删除一个相应的元组。 (4) 某一门课要修改一本参考书,只需要修改CB关系中一个相应的元组。

113 6.2 规范化 6.2.1 第一范式(1NF) 6.2.2 第二范式(2NF) 6.2.3 第三范式(3NF)
6.2.4 BC范式(BCNF) 6.2.5 多值依赖与第四范式(4NF) 6.2.6 规范化

114 6.2.6 规范化 关系数据库的规范化理论是数据库逻辑设计的工具。
一个关系只要其分量都是不可分的数据项,它就是规范化的关系,但这只是最基本的规范化。 规范化程度可以有6个不同的级别,即6个范式。

115 规范化(续) 规范化程度过低的关系不一定能够很好地描述现实世界,可能会存在插入异常、删除异常、修改复杂、数据冗余等问题,解决方法就是对其进行规范化,转换成高级范式。 一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式集合,这种过程就叫关系模式的规范化。

116 规范化(续) 关系模式规范化的基本步骤 1NF ↓ 消除非主属性对码的部分函数依赖 消除决定属性 2NF
↓ 消除非主属性对码的部分函数依赖 消除决定属性 2NF 集非码的非平 ↓ 消除非主属性对码的传递函数依赖 凡函数依赖 NF ↓ 消除主属性对码的部分和传递函数依 赖 BCNF ↓ 消除非平凡且非函数依赖的多值依赖 4NF

117 规范化(续) 规范化的基本思想是逐步消除数据依赖中不合适的部分,使模式中的各关系模式达到某种程度的“分离”,即采用“一事一地”的模式设计原则,让一个关系描述一个概念、一个实体或者实体间的一种联系。若多于一个概念就把它“分离”出去。因此所谓规范化实质上是概念的单一化。

118 规范化(续) 不能说规范化程度越高的关系模式就越好。在设计数据库模式结构时,必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适的、能够反映现实世界的模式。这也就是说,上面的规范化步骤可以在其中任何一步终止。

119 第六章 关系数据理论 6.1 数据依赖 6.2 规范化 6.3 数据依赖的公理系统 6.4 模式的分解

120 6.3 数据依赖的公理系统 逻辑蕴含 定义6.11 对于满足一组函数依赖F的关系模式R <U,F>,其任何一个关系r,若函数依赖X→Y都成立(即r中任意两元组t,s,若t[X]=s[X],则 t[Y ] = s[Y]),则称F逻辑蕴含X →Y。

121 数据依赖的公理系统(续) Armstrong公理系统 一套推理规则,是模式分解算法的理论基础 用途 内容 求给定关系模式的码
从一组函数依赖求得蕴含的函数依赖 内容

122 1. Armstrong公理系统 Armstrong公理系统 设U为属性集总体,F是U上的一组函数依赖, 于是有关系模式R <U,F >。对R <U,F> 来说有以下的推理规则: Al.自反律(Reflexivity):若Y  X  U,则X →Y为F所蕴含。 A2.增广律(Augmentation):若X→Y为F所蕴含,且Z  U,则XZ→YZ为F所蕴含。 A3.传递律(Transitivity):若X→Y及Y→Z为F所蕴含,则X→Z为F所蕴含。 注意:由自反律所得到的函数依赖均是平凡的函数依赖,自反律的使用并不依赖于F。

123 Armstrong公理系统(续) 定理6.l Armstrong推理规则是正确的。 证 (l)自反律 设Y  X  U 。
对R <U,F> 的任一关系r中的任意两个元组t,s: 若t[X]=s[X],由于Y  X,有t[y]=s[y], 所以X→Y成立. 自反律得证。

124 Armstrong公理系统(续) (2)增广律 设X→Y为F所蕴含,且Z  U。
设R<U,F> 的任一关系r中任意的两个元组t,s; 若t[XZ]=s[XZ],则有t[X]=s[X]和t[Z]=s[Z]; 由X→Y,于是有t[Y]=s[Y],所以t[YZ]=s[YZ],所以XZ→YZ为F所蕴含. 增广律得证。

125 Armstrong公理系统(续) (3) 传递律 设X→Y及Y→Z为F所蕴含。
对R<U,F> 的任一关系r中的任意两个元组t,s。 若t[X]=s[X],由于X→Y,有t[Y]=s[Y]; 再由Y→Z,有t[Z]=s[Z],所以X→Z为F所蕴含. 传递律得证。

126 2. 导出规则 1.根据A1,A2,A3这三条推理规则可以得到下面三条推理规则: 合并规则:由X→Y,X→Z,有X→YZ。
(A2, A3) X→Y X ,XY →ZY 伪传递规则:由X→Y,WY→Z,有XW→Z。 (A2, A3) XW→YW 分解规则:由X→Y及ZY,有X→Z。 (A1, A3) ZY,Y→Z

127 导出规则 2.根据合并规则和分解规则,可得引理6.1
引理6.l X→A1 A2…Ak成立的充分必要条 件是X→Ai成立(i=l,2,…,k)。

128 3. 函数依赖闭包 闭包 定义6.l2 在关系模式R<U,F>中为F所逻辑蕴含的函数依赖的全体叫作F的闭包,记为F+。
定义6.13 设F为属性集U上的一组函数依赖,X U, XF+ ={ A|X→A能由F根据Armstrong公理导出},XF+称为属性集X关于函数依赖集F的闭包。

129 F的闭包 F={ X→Y,Y→Z }, F + = { X→φ, Y→φ,Z→φ, XY→φ, XZ →φ,YZ →φ, XYZ →φ,
X →X, Y→Y, Z→Z, XY → X, XZ→X, YZ→Y, XYZ→X, X → Y, Y → Z , XY → Y, XZ→Y, YZ →Z, XYZ → Y, X → Z, Y → YZ, XY → Z, XZ→Z, YZ →YZ, XYZ → Z, X → XY, XY → XY, XZ → XY, XYZ → XY, X → XZ, XY → YZ, XZ → XZ, XYZ → YZ X → YZ, XY → XZ, XZ → XY, XYZ → XZ, XY → XYZ, XZ → XYZ, XYZ → XYZ }

130 函数依赖闭包 关于闭包的引理 引理6.2 设F为属性集U上的一组函数依赖,X, Y  U,X→Y能由F根据Armstrong公理导出的 充分必要条件是Y XF+。 引理6.2可由引理6.1得出 引理6.2的用途 将判定X→Y是否能由F根据Armstrong公理导出的问题,就转化为求出XF+ ,判定Y是否为XF+的子集的问题。

131 函数依赖闭包 求闭包的算法 算法6.l 求属性集X(X  U)关于U上的函 数依赖集F的闭包XF+ 。 输入:X,F 输出:XF+ 步骤:

132 函数依赖闭包 (1)令X(0)=X,i=0 (2)求B,这里B = { A |( V)(  W)(V→WF
∧V  X(i)∧A W)}; (3)X(i+1)=B∪X(i) (4)判断X(i+1)= X (i)吗? (5)若相等或X(i)=U , 则X(i)就是XF+ , 算法终止。 (6)若否,则i=i+l,返回第(2)步。

133 函数依赖闭包 对于算法6.l, 令ai =|X(i)|,{ai }形成一个步长大于1的严格递增的序列,序列的上界是 | U |,因此该算法最多 |U| - |X| 次循环就会终止。

134 函数依赖闭包 [例1] 已知关系模式R<U,F>,其中 U={A,B,C,D,E};
F={AB→C,B→D,C→E,EC→B,AC→B}。 求(AB)F+ 。 解 设X(0)=AB; (1)计算X(1): 逐一的扫描F集合中各个函数依赖,找左部为A,B或AB的函数依赖。得到两个:AB→C,B→D。 于是X(1)=AB∪CD=ABCD。

135 函数依赖闭包 (2)因为X(0)≠ X(1) ,所以再找出左部为ABCD子集的那些函数依赖,又得到AB→C,B→D, C→E,AC→B,
于是X(2)=X(1)∪BCDE=ABCDE。 (3)因为X(2)=U,算法终止 所以(AB)F+ =ABCDE。

136 4. Armstrong公理系统的有效性与完备性
有效性与完备性的含义 有效性:由F出发根据Armstrong公理推导出来的每一个函数依赖一定在F+中 完备性:F+中的每一个函数依赖,必定可以由F出发根据Armstrong公理推导出来

137 Armstrong公理系统的有效性与完备性(续)
有效性与完备性的证明 定理6.2 Armstrong公理系统是有效的、完备的。 证明: 1. 有效性 可由定理6.l得证

138 Armstrong公理系统的有效性与完备性(续)
2. 完备性 只需证明逆否命题: 若函数依赖X→Y不能由F从Armstrong公理导出,那么它必然不为F所蕴含 分三步证明:

139 Armstrong公理系统的有效性与完备性(续)
(1) 若V→W成立,且V  XF+,则W  XF+ 证 因为 V  XF+ ,所以有X→V成立; 因为X →V,V→W,于是X→W成立 所以W  XF+ 。 (2) 构造一张二维表r,它由下列两个元组 构成,可以证明r必是R(U,F)的一个 关系,即F中的全部函数依赖在 r上成立。

140 Armstrong公理系统的有效性与完备性(续)
XF+ U-XF+     若r不是R<U,F> 的关系,则必由于F中有函数依赖V→W在r上不成立所致。由r的构成可知,V必定是XF+ 的子集,而W不是XF+ 的子集,可是由第(1)步,W  XF+,矛盾。所以r必是R<U,F>的一个关系。

141 Armstrong公理系统的有效性与完备性(续)
(3)若X→Y不能由F从Armstrong公理导出,则Y不是XF+的子集。(引理6.2) 因此必有Y的子集Y’满足Y’U-XF+,则X→Y在 r 中不成立,即X→Y必不为R<U,F> 蕴含。

142 Armstrong公理系统的有效性与完备性(续)
“蕴含” == “导出” 是等价的概念 F+ :F+ 可以说成由F出发借助Armstrong公理导出的函数依赖的集合 F+ :为F所逻辑蕴含的函数依赖的全体(定义6.l2 )

143 5. 函数依赖集等价 函数依赖集等价定义 定义6.14 如果G+=F+,就说函数依赖集F 覆盖G(F是G的覆盖,或G是F的覆盖), 或F与G等价。

144 函数依赖集等价 函数依赖集等价的充要条件 引理6.3 F+ = G+ 的充分必要条件是F  G+ ,和G  F+ 。
证: 必要性显然,只证充分性。 (1)若FG+ ,则XF+  XG++ 。 (2)任取X→YF+ 则有 Y  XF+  XG++ 。 所以X→Y  (G+)+= G+。即F+  G+。 (3)同理可证G+  F+ ,所以F+ = G+。

145 函数依赖集等价 要判定F  G+,只须逐一对F中的函数依赖X→Y,考察 Y 是否属于XG++ 就行了。因此引理6.3给出了判断两个函数依赖集等价的可行算法。

146 6. 最小依赖集 极小函数依赖集 定义6.15 如果函数依赖集F满足下列条件,则称F为一个极小函数依赖集。亦称为最小依赖集或最小覆盖。
(2) F中不存在这样的函数依赖X→A,使得F与 F-{X→A}等价。 (3) F中不存在这样的函数依赖X→A, X有真 子集Z使得F-{X→A}∪{Z→A}与F等价。

147 最小依赖集 [例2] 对于6.l节中的关系模式S<U,F>,其中: U={ SNO,SDEPT,MN,CNAME,G },
F={ SNO→SDEPT,SDEPT→MN,(SNO,CNAME)→G } 设F’={SNO→SDEPT,SNO→MN,SDEPT→MN, (SNO,CNAME)→G, (SNO,SDEPT)→SDEPT} F是最小覆盖,而F ’不是。 因为:F ’-{SNO→MN}与F ’等价 F ’-{(SNO,SDEPT)→SDEPT}也与F ’等价

148 7. 极小化过程 定理6.3 每一个函数依赖集F均等价于一个极小函数依赖集Fm。此Fm称为F的最小依赖集。
(1)逐一检查F中各函数依赖FDi:X→Y, 若Y=A1A2 …Ak,k>2, 则用{X→Aj |j=1,2,…, k}来取代X→Y。 引理6.1保证了F变换前后的等价性。

149 极小化过程 (2)逐一检查F中各函数依赖FDi:X→A, 令G=F-{X→A}, 若AXG+, 则从F中去掉此函数依赖。
由于F与G =F-{X→A}等价的充要条件是AXG+ 因此F变换前后是等价的。

150 极小化过程 (3)逐一取出F中各函数依赖FDi:X→A, 设X=B1B2…Bm, 逐一考查Bi (i=l,2,…,m),
若A (X-Bi )F+ , 则以X-Bi 取代X。 由于F与F-{X→A}∪{Z→A}等价的充要条件是AZF+ ,其中Z=X-Bi 因此F变换前后是等价的。

151 极小化过程 由定义,最后剩下的F就一定是极小依赖集。
因为对F的每一次“改造”都保证了改造前后的两个函数依赖集等价,因此剩下的F与原来的F等价。 证毕

152 极小化过程 定理6.3的证明过程也是求F极小依赖集的过程。

153 极小化过程 [例3] F = {A→B,B→A,B→C, A→C,C→A} F的最小依赖集: Fm1= {A→B,B→C,C→A}  

154 极小化过程 F的最小依赖集Fm不一定是唯一的,它与对各函数依赖FDi 及X→A中X各属性的处置顺序有关。

155 极小化过程 [例3] (续) F = {A→B,B→A,B→C, A→C,C→A} Fm1、Fm2都是F的最小依赖集:
Fm1= {A→B,B→C,C→A}   Fm2= {A→B,B→A,A→C,C→A}

156 极小化过程 极小化过程( 定理6.3的证明 )也是检验F是否为极小依赖集的一个算法 若改造后的F与原来的F相同,说明F本身就是一个最小依赖集

157 极小化过程 在R<U,F>中可以用与F等价的依赖集G来取代F
原因:两个关系模式R1 <U,F>,R2<U,G>,如果F与G等价,那么R1的关系一定是R2的关系。反过来,R2的关系也一定是R1的关系。

158 第六章 关系数据理论 6.1 数据依赖 6.2 规范化 6.3 数据依赖的公理系统 6.4 模式的分解

159 6.4 模式的分解 关系模式的规范化过程是通过对关系模式的分解来实现的 把低一级的关系模式分解为若干个高一级的关系模式的方法并不是唯一的
在这些分解方法中,只有能够保证分解后的关系模式与原关系模式等价的方法才有意义

160 模式的分解(续) 将一个关系模式R<U,F>分解为若干个关系模式R1<U1,F1>,R2<U2,F2>,… ,Rn<Un,Fn>(其中U=U1∪U2∪… ∪Un,且不存在Ui  Uj,Fi为F在Ui上的投影),意味着相应地将存储在一个二维表t中的数据分散到若干个二维表t1,t2,… ,tn中去(其中ti是t在属性集Ui上的投影)。

161 模式的分解(续) 例:对于关系模式SL(Sno, Sdept, Sloc),SL中有下列函数依赖: Sno→Sdept Sdept→Sloc
Sno→Sloc 已知SL∈2NF,该关系模式存在插入异常、删除异常、数据冗余度大和修改复杂的问题。 因此需要分解该关系模式,使成为更高范式的关系模式。分解方法可以有很多种。

162 模式的分解(续) 假设下面是该关系模式的一个关系: SL ──────────────────
Sno Sdept Sloc ────────────────── CS A IS B MA C IS B PH B ──────────────────

163 模式的分解(续) 第一种分解方法 将SL分解为下面三个关系模式: SN(Sno) SD(Sdept) SO(Sloc)

164 模式的分解(续) 分解后的关系为: SN ────── SD ────── SO ────── Sno Sdept Sloc
────── ────── ────── CS A IS B MA C PH ───── ────── ──────

165 模式的分解(续) SN、SD和SO都是规范化程度很高的关系模式(5NF)。但分解后的数据库丢失了许多信息,例如无法查询95001学生所在系或所在宿舍。因此这种分解方法是不可取的。 如果分解后的关系可以通过自然连接恢复为原来的关系,那么这种分解就没有丢失信息。

166 模式的分解(续) 第二种分解方法 将SL分解为下面二个关系模式: NL(Sno, Sloc) DL(Sdept, Sloc)
分解后的关系为: NL ──────────── DL ──────────── Sno Sloc Sdept Sloc ──────────── ──────────── A CS A B IS B C MA C B PH B B ──────────── ──────────

167 模式的分解(续) 对NL和DL关系进行自然连接的结果为: NL DL Sno Sloc Sdept 95001 A CS
B IS B PH C MA B IS B PH B IS B PH

168 模式的分解(续) NL DL比原来的SL关系多了三个元组 (95002, B, PH) (95004, B, PH)
(95005, B, IS) 因此我们也无法知道原来的SL关系中究竟有哪些元组,从这个意义上说,此分解方法仍然丢失了信息。

169 模式的分解(续) 第三种分解方法 将SL分解为下面二个关系模式: ND(Sno, Sdept) NL(Sno, Sloc) 分解后的关系为:

170 模式的分解(续) Sno Sdept Sno Sloc ──────────── ────────── 95001 CS 95001 A
ND ──────────── NL ────────── Sno Sdept Sno Sloc ──────────── ────────── CS A IS B MA C IS B PH B ──────────── ───────────

171 模式的分解(续) 对ND和NL关系进行自然连接的结果为: ND NL ─────────────── Sno Sdept Sloc
──────────────── CS A IS B MA C CS A PH B 它与SL关系完全一样,因此第三种分解方法没有丢失信息。

172 模式的分解(续) 具有无损连接性的模式分解
设关系模式R<U,F>被分解为若干个关系模式R1<U1,F1>,R2<U2,F2>,… ,Rn<Un,Fn>(其中U=U1∪U2∪… ∪Un,且不存在Ui  Uj,Fi为F在Ui上的投影),若R与R1、R2、…、Rn自然连接的结果相等,则称关系模式R的这个分解具有无损连接性(Lossless join)。 只有具有无损连接性的分解才能够保证不丢失信息。 无损连接性不一定能解决插入异常、删除异常、修改复杂、数据冗余等问题

173 模式的分解(续) 例: 上面的第三种分解方法虽然具有无损连接性,保证了不丢失原关系中的信息,但它并没有解决插入异常、删除异常、修改复杂、数据冗余等问题。 例如95001学生由CS系转到IS系,ND关系的(95001, CS)元组和NL关系的(95001, A)元组必须同时进行修改,否则会破坏数据库的一致性。 之所以出现上述问题,是因为分解得到的两个关系模式不是互相独立的。SL中的函数依赖Sdept→Sloc既没有投影到关系模式ND上,也没有投影到关系模式NL上,而是跨在这两个关系模式上。也就是这种分解方法没有保持原关系中的函数依赖。

174 模式的分解(续) 保持函数依赖的模式分解 设关系模式R<U,F>被分解为若干个关系模式R1<U1,F1>,R2<U2,F2>,… ,Rn<Un,Fn> (其中U=U1∪U2∪… ∪Un,且不存在Ui  Uj,Fi为F在Ui上的投影),若F所逻辑蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖Fi所逻辑蕴含,则称关系模式R的这个分解是保持函数依赖的(Preserve dependency)。

175 模式的分解(续) 例:第四种分解方法 将SL分解为下面二个关系模式: ND(Sno, Sdept) DL(Sdept, Sloc)
这种分解方法就保持了函数依赖。

176 模式的分解(续) 判断对关系模式的一个分解是否与原关系模式等价的标准 ⒈ 分解具有无损连接性 ⒉ 分解要保持函数依赖
  ⒈ 分解具有无损连接性   ⒉ 分解要保持函数依赖   ⒊ 分解既要保持函数依赖,又要具有无损连接性

177 模式的分解(续) 如果一个分解具有无损连接性,则它能够保证不丢失信息。 如果一个分解保持了函数依赖,则它可以减轻或解决各种异常情况。
分解具有无损连接性和分解保持函数依赖是两个互相独立的标准。具有无损连接性的分解不一定能够保持函数依赖。同样,保持函数依赖的分解也不一定具有无损连接性。

178 模式的分解(续) 例:上例中 第一种分解方法既不具有无损连接性,也未保持函数依赖,它不是原关系模式的一个等价分解。
第二种分解方法不具有无损连接性,也未保持函数依赖。 第三种分解方法具有无损连接性,但未持函数依赖。 第四种分解方法既具有无损连接性,又保持了函数依赖。

179 模式的分解(续) 规范化理论提供了一套完整的模式分解算法,按照这套算法可以做到: 若要求分解具有无损连接性,那么模式分解一定能够达到4NF。
若要求分解保持函数依赖,那么模式分解一定能够达到3NF,但不一定能够达到BCNF。 若要求分解既具有无损连接性,又保持函数依赖,则模式分解一定能够达到3NF,但不一定能够达到BCNF。

180 分解算法 算法6.2 判别一个分解的无损连接性 算法6.3(合成法)转换为3NF的保持函数依赖的分解
算法6.2 判别一个分解的无损连接性 算法6.3(合成法)转换为3NF的保持函数依赖的分解 算法6.4 转换为3NF既有无损连接性又保持函数依赖的分解 算法6.5 (分解法)转换为BCNF的无损连接分解 算法6.6 达到4NF的具有无损连接性的分解

181 小结 函数依赖 多值依赖 关系模式规范化的基本步骤 Armstrong公理系统

182 小结 一、函数依赖 函数依赖 平凡函数依赖与非平凡函数依赖 完全函数依赖与部分函数依赖 传递函数依赖

183 小结 二、多值依赖 多值依赖 平凡多值依赖和非平凡的多值依赖 多值依赖的性质 对称性 传递性

184 小结 三、关系模式规范化的基本步骤 1NF ↓ 消除非主属性对码的部分函数依赖 消除决定属性 2NF
↓ 消除非主属性对码的部分函数依赖 消除决定属性 2NF 集非码的非平 ↓ 消除非主属性对码的传递函数依赖 凡函数依赖 NF ↓ 消除主属性对码的部分和传递函数依 赖 BCNF ↓ 消除非平凡且非函数依赖的多值依赖 4NF

185 小结 四、Armstrong公理系统 Armstrong公理 求函数依赖闭包 求极小函数依赖集 自反律;增广律;传递律
合并规则;伪传递规则;分解规则 求函数依赖闭包 求极小函数依赖集

186 作业 习题 2 3 5 9 12 1 证明:若R属于BCNF。那么R属于3NF,反之不成立。
习题 1 证明:若R属于BCNF。那么R属于3NF,反之不成立。 2 “从已知的函数依赖集F使用推理规则集推不出的函数依赖,必定不在F + 中” ,这句话是指推理规则的有效性还是完备性?


Download ppt "An Introduction to Database System"

Similar presentations


Ads by Google