第五章 关系数据理论 关系模型有严格的数学理论基础,也是目前应用最广泛的数据模型,关系规范化是指导数据库设计的重要理论。一个好的关系数据库是应该既可以供人们方便地获取信息,而又不产生过多的不必要的重复存储问题。可以说,规范化理论是数据模型优化的理论基础,对其他数据库的逻辑设计同样具有理论上的意义。 2018年12月6日7时18分.

Slides:



Advertisements
Similar presentations
4.3 磁場內的載電流導體 電池車 作用於載電流導體的力 進度評估 5 進度評估 6 應用:電動機 進度評估 7
Advertisements

第8章 相关分析 一元线性相关分析 多元线性相关分析 相 关 分 析 相关系数 相关指数 直线相关 曲线相关 相关分析概述 相关分析的意义
高等院校计算机教材系列 数据库原理与应用(第2版) 任课教师:刘雅莉
第七章:数据库设计理论基础.
Access数据库程序设计 总复习.
第3章 关系数据库的基本理论 冯万利.
Principles and Applications of the Database
第4章 关系数据库设计理论 本章内容 4.1 问题的提出 4.2 规范化 4.3 数据依赖的公理系统* 4.4 小结 习 题.
清仓处理 跳楼价 满200返160 5折酬宾.
新世纪版(数学) 七年级(上)教材培训 青岛试验区.
软件设计师培训.
<<广东省中小学生体能素质评价标准>>
计算机应用基础 上海大学计算中心.
命题与四种命题 高二数学 选修2-1 第一章 常用逻辑用语.
命题的四种形式 高二数学.
1.1.2 四 种 命 题.
第六章 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解.
An Introduction to Database System
面向海洋的开放地区——珠江三角洲 山东省高青县实验中学:郑宝田.
数据库原理 Database Principles 第五章 数据库完整性 Database Principles.
第五章 定积分及其应用.
第4章 数据库技术及应用 软件开发技术基础 计算机教学实验中心 2006.
An Introduction to Database System An Introduction To Database System
An Introduction to Database System An Introduction to Database System
数据库技术 第十章 数据库完整性 中国科学技术大学网络学院 阚卫华.
你一定要認識的數學家.
第四章 关系数据理论 4.1 关系模式的设计问题 4.2 关系模式的规范化 4.3 数据依赖的公理系统 4.4 关系模式的分解 本章小结.
數位邏輯簡介.
課程名稱:資料庫系統 授課老師:李春雄 博士
課程名稱:資料庫系統 授課老師:李春雄 博士
第4章 SQL语言基础及数据库定义 4.1 基本概念 4.2 SQL Server 提供的主要数据类型 4.3 数据定义.
第7章 關聯式資料庫的正規化 7-1 正規化的基礎 7-2 功能相依 7-3 第一階到第三階正規化型式 7-4 多重值相依與第四階正規化型式
1、掌握为什么不合适的关系模式会带来插入异常、删除异常、 存储异常、修改困难等严重问题 2、深刻理解函数依赖、多值依赖等有关概念
教 师:曾晓东 电 话: 数据库技术 教 师:曾晓东 电 话:
胡鹏 王慧锋 TEL: 数据库系统原理课程设计 实验环节1 胡鹏 王慧锋 TEL:
第四章关系数据库设计理论 4.1 数据依赖 4.2 范式 4.3 关系模式的规范化.
吉林大学远程教育课件 数 字 逻 辑 (第十九讲) 主讲人 : 魏 达 学 时:48.
正規化 Normalization.
CH06 正規化概述.
Chapter 3 正規化與各種合併.
表格正規化簡介 講授大綱: 第一正規化 資料表的切割 第二正規化 第三正規化 Boyce/Codd正規化 第四正規化 第五正規化
数字电子技术 Digital Electronics Technology
Thanks for the Slides from Renmin U
国家“十一五”规划教材 数据库原理与应用教程(第3版).
SQL SERVER 一些经典语句 1.
1.3.1 函数的基本性质.
An Introduction to Database System An Introduction to Database System
高等数学提高班 (省专升本) 教师: 裴亚萍 数学教研室: 东校区 2118 电话: 长号:
第七章 求极值及解线性规划问题命令与例题.
第一节 相关概述 第二节 积差相关系数 第三节 其他相关系数
导数的应用 ——函数的单调性与极值.
二元一次聯立方程式 代入消去法 加減消去法 自我評量.
四川省天全中学说课竞赛 多媒体演示课件 ★ ☆ 函数的单调性 天全中学数学组 熊 亮.
课前注意 课前注意 大家好!欢迎加入0118班! 请注意以下几点: 1.服务:卡顿、听不清声音、看不见ppt—管家( ) 2.课堂秩序:公共课堂,勿谈与课堂无关或消极的话题。 3.答疑:上课听讲,课后答疑,微信留言。 4.联系方式:提示老师手机/微信: QQ:
第 四 章 迴歸分析應注意之事項.
9.1.2不等式的性质 周村实验中学 许伟伟.
利用平方差公式因式分解 利用和的平方公式因式分解 利用差的平方公式因式分解 綜合運用
C ( )下圖有 4 個邊長為 x 的正方形,4 個 長為 x、寬為 1 的長方形,以及 1 個 邊長為1 的正方形,則這 9 個圖形的
河北省昌黎县第三中学李晓荣.
分 解 因 式 保定市第二十六中学 刘彦莉.
(3.3.2) 函数的极值与导数.
An Introduction to Database System
認識函數.
連比 連比例式的應用 自我評量.
第3章 关系数据库 内容提要 关系模型的数据结构 关系模型的常用术语 关系数据库的完整性概念 数据库的关系运算 函数依赖的定义
第五章关系数据库设计理论 5.1 数据依赖 5.2 范式 5.3 关系模式的规范化.
12.1分解因式.
第二章 一元一次不等式和一元一次不等式组 回顾与复习(一).
大綱: 比例線段定義 平行線截比例線段性質 顧震宇 台灣數位學習科技股份有限公司
函数与导数 临猗中学 陶建厂.
Presentation transcript:

第五章 关系数据理论 关系模型有严格的数学理论基础,也是目前应用最广泛的数据模型,关系规范化是指导数据库设计的重要理论。一个好的关系数据库是应该既可以供人们方便地获取信息,而又不产生过多的不必要的重复存储问题。可以说,规范化理论是数据模型优化的理论基础,对其他数据库的逻辑设计同样具有理论上的意义。 2018年12月6日7时18分 周口师范学院计算机科学系

5.1 问题的提出 5.2 规范化 5.3 数据依赖的公理系统 *5.4 模式的分解 5.5 小结 本章主要介绍以下几个方面的内容: 5.1 问题的提出 5.2 规范化 5.3 数据依赖的公理系统 *5.4 模式的分解 5.5 小结 2018年12月6日7时18分 周口师范学院计算机科学系

5.1 问题的提出 关系数据库逻辑设计 针对具体问题,如何构造一个适合于它的数据模式 数据库逻辑设计的工具──关系数据库的规范化理论 2018年12月6日7时18分 周口师范学院计算机科学系

问题的提出 一、概念回顾 二、关系模式的形式化定义 三、什么是数据依赖 四、关系模式的简化定义 五、数据依赖对关系模式影响 2018年12月6日7时18分 周口师范学院计算机科学系

一、概念回顾 关系:用于描述实体、属性、实体间的联系。 从形式上看,它是一张二维表,是所涉及属性的笛卡尔积的一个子集。 关系模式:用来定义关系。 关系数据库:基于关系模型的数据库,利用关系来描述现实世界。 从形式上看,它由一组关系组成。 关系数据库的模式:定义这组关系的关系模式的全体 2018年12月6日7时18分 周口师范学院计算机科学系

二、关系模式的形式化定义 关系模式由五部分组成,即它是一个五元组: R(U, D, DOM, F) R: 关系名 D: 属性组U中属性所来自的域 DOM: 属性向域的映象集合 F: 属性间数据的依赖关系集合 2018年12月6日7时18分 周口师范学院计算机科学系

三、什么是数据依赖 1. 完整性约束的表现形式 限定属性取值范围:例如学生成绩必须在0-100之间 定义属性值间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键 2018年12月6日7时18分 周口师范学院计算机科学系

2. 数据依赖 是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系 是现实世界属性间相互联系的抽象 是数据内在的性质 是语义的体现 2018年12月6日7时18分 周口师范学院计算机科学系

3. 数据依赖的类型 函数依赖(Functional Dependency,简记为FD) 多值依赖(Multivalued Dependency,简记为MVD) 其他 2018年12月6日7时18分 周口师范学院计算机科学系

四、关系模式的简化表示 关系模式R(U, D, DOM, F) 简化为一个三元组: R(U, F) 当且仅当U上的一个关系r 满足F时,r称为关系模式 R(U, F)的一个关系 2018年12月6日7时18分 周口师范学院计算机科学系

学生的学号(Sno)、所在系(Sdept) 系主任姓名(Mname)、课程名(Cname) 成绩(Grade) 五、数据依赖对关系模式的影响 例:描述学校的数据库: 学生的学号(Sno)、所在系(Sdept) 系主任姓名(Mname)、课程名(Cname) 成绩(Grade) 单一的关系模式 : Student <U、F> U ={ Sno, Sdept, Mname, Cname, Grade } 2018年12月6日7时18分 周口师范学院计算机科学系

学校数据库的语义: ⒈ 一个系有若干学生, 一个学生只属于一个系; ⒉ 一个系只有一名主任; ⒈ 一个系有若干学生, 一个学生只属于一个系; ⒉ 一个系只有一名主任; ⒊ 一个学生可以选修多门课程, 每门课程有若干学生选修; ⒋ 每个学生所学的每门课程都有一个成绩。 2018年12月6日7时18分 周口师范学院计算机科学系

属性组U上的一组函数依赖F: F ={ Sno → Sdept, Sdept → Mname, (Sno, Cname) → Grade } 2018年12月6日7时18分 周口师范学院计算机科学系

关系模式Student<U, F>中存在的问题 ⒈ 数据冗余太大 浪费大量的存储空间 例:每一个系主任的姓名重复出现 ⒉ 更新异常(Update Anomalies) 数据冗余 ,更新数据时,维护数据完整性代价大。 例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组 2018年12月6日7时18分 周口师范学院计算机科学系

⒊ 插入异常(Insertion Anomalies) 该插的数据插不进去 例,如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。 ⒋ 删除异常(Deletion Anomalies) 不该删除的数据不得不删 例,如果某个系的学生全部毕业了, 我们在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。 2018年12月6日7时18分 周口师范学院计算机科学系

原因:由存在于模式中的某些数据依赖引起的 解决方法:通过分解关系模式来消除其中不合适的数据依赖。 结论: Student关系模式不是一个好的模式。 “好”的模式: 不会发生插入异常、删除异常、更新异常, 数据冗余应尽可能少。 原因:由存在于模式中的某些数据依赖引起的 解决方法:通过分解关系模式来消除其中不合适的数据依赖。 2018年12月6日7时18分 周口师范学院计算机科学系

5.2 规范化 规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。 2018年12月6日7时18分 周口师范学院计算机科学系

5.2.1 函数依赖 一、函数依赖 二、平凡函数依赖与非平凡函数依赖 三、完全函数依赖与部分函数依赖 四、传递函数依赖 2018年12月6日7时18分 周口师范学院计算机科学系

一、函数依赖 定义5.1 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。 若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作X→Y。 X称为这个函数依赖的决定属性集(Determinant)。 Y=f(x) 2018年12月6日7时18分 周口师范学院计算机科学系

说明: 1. 函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。 2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。 例如“姓名→年龄”这个函数依赖只有在不允许有同名人的条件下成立 3. 数据库设计者可以对现实世界作强制的规定。例如规定不允许同名人出现,函数依赖“姓名→年龄”成立。所插入的元组必须满足规定的函数依赖,若发现有同名人存在, 则拒绝装入该元组。 2018年12月6日7时18分 周口师范学院计算机科学系

例: Student(Sno, Sname, Ssex, Sage, Sdept) 假设不允许重名,则有: Sno → Ssex, Sno → Sage , Sno → Sdept, Sno ←→ Sname, Sname → Ssex, Sname → Sage Sname → Sdept 但Ssex →Sage 若X→Y,并且Y→X, 则记为X←→Y。 若Y不函数依赖于X, 则记为X─→Y 2018年12月6日7时18分 周口师范学院计算机科学系

二、平凡函数依赖与非平凡函数依赖 在关系模式R(U)中,对于U的子集X和Y, 如果X→Y,但Y  X,则称X→Y是非平凡的函数依赖 例:在关系SC(Sno, Cno, Grade)中, 非平凡函数依赖: (Sno, Cno) → Grade 平凡函数依赖: (Sno, Cno) → Sno (Sno, Cno) → Cno 2018年12月6日7时18分 周口师范学院计算机科学系

对于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明, 我们总是讨论非平凡函数依赖。 2018年12月6日7时18分 周口师范学院计算机科学系

三、完全函数依赖与部分函数依赖 定义5.2 在关系模式R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有 X’ Y, 则称Y完全函数依赖于X, 记作X f Y。 若X→Y,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作X P Y 2018年12月6日7时18分 周口师范学院计算机科学系

例: 在关系SC(Sno, Cno, Grade)中, 由于:Sno Grade,Cno Grade, 2018年12月6日7时18分 周口师范学院计算机科学系

四、传递函数依赖 定义5.3 在关系模式R(U)中,如果X→Y,Y→Z,且Y X,Y→X,则称Z传递函数依赖于X。 注: 如果Y→X, 即X←→Y,则Z直接依赖于X。 例: 在关系Std(Sno, Sdept, Mname)中,有: Sno → Sdept,Sdept → Mname Mname传递函数依赖于Sno 2018年12月6日7时18分 周口师范学院计算机科学系

5.2.2 码 定义5.4 设K为关系模式R<U,F>中的属性或属性组合。若K F U,则K称为R的一个侯选码(Candidate Key)。若关系模式R有多个候选码,则选定其中的一个做为主码(Primary key)。 主属性与非主属性 ALL KEY 2018年12月6日7时18分 周口师范学院计算机科学系

外部码 定义5.5 关系模式 R 中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign key)也称外码 主码又和外部码一起提供了表示关系间联系的手段。 2018年12月6日7时18分 周口师范学院计算机科学系

5.2.3 范式 范式的种类: 第一范式(1NF) 第二范式(2NF) 第三范式(3NF) BC范式(BCNF) 第四范式(4NF) 范式是符合某一种级别的关系模式的集合。 关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。 满足最低要求的为第一范式,简称1NF,在第一范式的中满足进一步要求的为第二范式,其余以此类推。 范式的种类: 第一范式(1NF) 第二范式(2NF) 第三范式(3NF) BC范式(BCNF) 第四范式(4NF) 第五范式(5NF) 2018年12月6日7时18分 周口师范学院计算机科学系

各种范式之间存在联系:后者是前者的真子集 1NF 2NF 3NF BCNF 4NF 5NF 一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程称为规范化。 某一关系模式R为第n范式,可简记为R∈nNF。 2018年12月6日7时18分 周口师范学院计算机科学系

5.2.4 2NF 1NF的定义 如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。 第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。 但是满足第一范式的关系模式并不一定是一个好的关系模式。 2018年12月6日7时18分 周口师范学院计算机科学系

例: 关系模式 SLC(Sno, Sdept, Sloc, Cno, Grade) Sloc为学生住处,假设每个系的学生住在同一个地方。 函数依赖包括: (Sno, Cno) f Grade Sno → Sdept (Sno, Cno) P Sdept Sno → Sloc (Sno, Cno) P Sloc Sdept → Sloc 2018年12月6日7时18分 周口师范学院计算机科学系

SLC Sno Sdept Grade Cno Sloc SLC的码为(Sno, Cno) SLC满足第一范式。 非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno),(Sno,Cno) Grade, Sdept Sloc Grade Sloc 2018年12月6日7时18分 周口师范学院计算机科学系

SLC不是一个好的关系模式 (1) 插入异常 假设Sno=95102,Sdept=IS,Sloc=N的学生还未选课,因课程号是主属性,因此该学生的信息无法插入SLC。 (2) 删除异常 假定某个学生本来只选修了3号课程这一门课。现在因身体不适,他连3号课程也不选修了。因课程号是主属性,此操作将导致该学生信息的整个元组都要删除。 2018年12月6日7时18分 周口师范学院计算机科学系

如果一个学生选修了10门课程,那么他的Sdept和Sloc值就要重复存储了10次。 (4) 修改复杂 (3) 数据冗余度大 如果一个学生选修了10门课程,那么他的Sdept和Sloc值就要重复存储了10次。 (4) 修改复杂 例如学生转系,在修改此学生元组的Sdept值的同时,还可能需要修改住处(Sloc)。如果这个学生选修了K门课,则必须无遗漏地修改K个元组中全部Sdept、Sloc信息。 2018年12月6日7时18分 周口师范学院计算机科学系

SLC分解为两个关系模式,以消除这些部分函数依赖 SC(Sno, Cno, Grade) SL(Sno, Sdept, Sloc) 原因 Sdept、 Sloc部分函数依赖于码。 解决方法 SLC分解为两个关系模式,以消除这些部分函数依赖 SC(Sno, Cno, Grade) SL(Sno, Sdept, Sloc) 2018年12月6日7时18分 周口师范学院计算机科学系

函数依赖图 SC SL Sno Cno Sdept Sloc sc SLC 2018年12月6日7时18分 周口师范学院计算机科学系

2NF的定义 定义5.6 若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。 例: SLC(Sno, Sdept, Sloc, Cno, Grade) ∈1NF SLC(Sno, Sdept, Sloc, Cno, Grade) ∈2NF SC(Sno, Cno, Grade) ∈ 2NF SL(Sno, Sdept, Sloc) ∈ 2NF 2018年12月6日7时18分 周口师范学院计算机科学系

将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。 采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。 2018年12月6日7时18分 周口师范学院计算机科学系

5.2.5 3NF 例:2NF关系模式SL(Sno, Sdept, Sloc)中 函数依赖: Sno→Sdept Sdept→Sloc Sno→Sloc Sloc传递函数依赖于Sno,即SL中存在非主属性对码的传递函数依赖。 2018年12月6日7时18分 周口师范学院计算机科学系

函数依赖图 SL Sdept Sloc sc 2018年12月6日7时18分 周口师范学院计算机科学系

采用投影分解法,把SL分解为两个关系模式,以消除传递函数依赖: SD(Sno, Sdept) DL(Sdept, Sloc) 解决方法 采用投影分解法,把SL分解为两个关系模式,以消除传递函数依赖: SD(Sno, Sdept) DL(Sdept, Sloc) SD的码为Sno, DL的码为Sdept。 Sno Sdept Sdept Sloc SD DL 2018年12月6日7时18分 周口师范学院计算机科学系

3NF的定义 定义5.8 关系模式R<U,F> 中若不存在这样的码X、属性组Y及非主属性Z(Z  Y), 使得X→Y,Y → X,Y→Z,成立, 则称R<U,F> ∈ 3NF。 例 SL(Sno, Sdept, Sloc) ∈ 2NF  SL(Sno, Sdept, Sloc) ∈ 3NF SD(Sno, Sdept) ∈ 3NF DL(Sdept, Sloc) ∈ 3NF 2018年12月6日7时18分 周口师范学院计算机科学系

若R∈3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。 如果R∈3NF,则R也是2NF。 采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个2NF关系分解为多个3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余。 2018年12月6日7时18分 周口师范学院计算机科学系

5.2.6 BC范式(BCNF) 定义5.9 设关系模式R<U,F>∈1NF,如果对于R的每个函数依赖X→Y,若Y不包含于X,则X必含有候选码,那么R∈BCNF。 若R∈BCNF 每一个决定属性集(因素)都包含(候选)码 R中的所有属性(主,非主属性)都完全函数依赖于码 R∈3NF(证明) 若R∈3NF 则 R不一定∈BCNF 2018年12月6日7时18分 周口师范学院计算机科学系

例:在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。 每一教师只教一门课。每门课由若干教师教,某一学生选定某门课,就确定了一个固定的教师。某个学生选修某个教师的课就确定了所选课的名称 : (S,J)→T,(S,T)→J,T→J S S T J J T STJ 2018年12月6日7时18分 周口师范学院计算机科学系

STJ∈3NF (S,J)和(S,T)都可以作为候选码 S、T、J都是主属性 STJ∈BCNF T→J,T是决定属性集,T不是候选码 2018年12月6日7时18分 周口师范学院计算机科学系

解决方法:将STJ分解为二个关系模式: SJ(S,J) ∈ BCNF, TJ(T,J)∈ BCNF 没有任何属性对码的部分函数依赖和传递函数依赖 S T T J SJ TJ 2018年12月6日7时18分 周口师范学院计算机科学系

BCNF的关系模式所具有的性质 ⒈ 所有非主属性都完全函数依赖于每个候选码 ⒉ 所有主属性都完全函数依赖于每个不包含它的候选码 ⒊ 没有任何属性完全函数依赖于非码的任何一组属性 2018年12月6日7时18分 周口师范学院计算机科学系

3NF与BCNF的关系 如果关系模式R∈BCNF, 必定有R∈3NF 如果R∈3NF,且R只有一个候选码, 则R必属于BCNF。 2018年12月6日7时18分 周口师范学院计算机科学系

3NF和BCNF是在函数依赖的条件下对模式分解所能达到的分离程度的测度。一个模式中的关系模式如果都属于BCNF,那么在函数依赖范畴内,它已实现了彻底的分离,已消除了插入和删除的异常。3NF的“不彻底”性表现在可能存在主属性对码的部分信赖和传递依赖。 2018年12月6日7时18分 周口师范学院计算机科学系

5.2.5 多值依赖与第四范式(4NF) 例: 学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。 关系模式Teaching(C, T, B) 课程C、教师T 和 参考书B 2018年12月6日7时18分 周口师范学院计算机科学系

表5.1 课程 教员T 参考书目B 物理 李勇 王军 普通物理学 光学原理 物理习题集 数学 张平 数学分析 微分方程 高等代数 计算数学 周峰 2018年12月6日7时18分 周口师范学院计算机科学系

用二维表表示Teaching 课程C 教员T 参考书目B 物理 数学 … 李勇 王军 普通物理学 光学原理 物理习题集普通物理学 物理习题集 数学分析 微分方程 高等代数. ... 2018年12月6日7时18分 周口师范学院计算机科学系

Teaching具有唯一候选码(C,T,B), 即全码 Teaching模式中存在的问题 Teaching∈BCNF: Teaching具有唯一候选码(C,T,B), 即全码 Teaching模式中存在的问题 (1)数据冗余度大:有多少名任课教师,参考书就要存储多少次 (2)插入操作复杂:当某一课程增加一名任课教师时,该课程有多少本参照书,就必须插入多少个元组 例如物理课增加一名教师刘关,需要插入两个元组: (物理,刘关,普通物理学) (物理,刘关,光学原理) 2018年12月6日7时18分 周口师范学院计算机科学系

(3) 删除操作复杂:某一门课要去掉一本参考书,该课程有多少名教师,就必须删除多少个元组 (4) 修改操作复杂:某一门课要修改一本参考书,该课程有多少名教师,就必须修改多少个元组 产生原因 存在多值依赖 2018年12月6日7时18分 周口师范学院计算机科学系

一、多值依赖 定义5.10 设R(U)是一个属性集U上的一个关系模式, X、 Y和Z是U的子集,并且Z=U-X-Y,多值依赖 X→→Y成立当且仅当对R的任一关系r,r在(X,Z)上的每个值对应一组Y的值,这组值仅仅决定于X值而与Z值无关 例 Teaching(C, T, B) 对于C的每一个值,T有一组值与之对应,而不论B取何值 2018年12月6日7时18分 周口师范学院计算机科学系

在R(U)的任一关系r中,如果存在元组t,s 使得t[X]=s[X],那么就必然存在元组 w,v r,(w,v可以与s,t相同),使得w[X]=v[X]=t[X],而w[Y]=t[Y],w[Z]=s[Z],v[Y]=s[Y],v[Z]=t[Z](即交换s,t元组的Y值所得的两个新元组必在r中),则Y多值依赖于X,记为X→→Y。 这里,X,Y是U的子集,Z=U-X-Y。 t x y1 z2 s x y2 z1 w x y1 z1 v x y2 z2 2018年12月6日7时18分 周口师范学院计算机科学系

若X→→Y,而Z=φ,则称 X→→Y为平凡的多值依赖 否则称X→→Y为非平凡的多值依赖 平凡多值依赖和非平凡的多值依赖 若X→→Y,而Z=φ,则称 X→→Y为平凡的多值依赖 否则称X→→Y为非平凡的多值依赖 2018年12月6日7时18分 周口师范学院计算机科学系

多值依赖的性质 (1)多值依赖具有对称性 若X→→Y,则X→→Z,其中Z=U-X-Y 多值依赖的对称性可以用完全二分图直观地表示出来。 (2)多值依赖具有传递性 若X→→Y,Y→→Z, 则X→→Z -Y 2018年12月6日7时18分 周口师范学院计算机科学系

多值依赖的对称性 Yi1 Yi2 … Yin xi Zi1 Zi2 … Zim 2018年12月6日7时18分 周口师范学院计算机科学系

(4)若X→→Y,X→→Z,则X→→Y U Z。 (5)若X→→Y,X→→Z,则X→→Y∩Z。 (6)若X→→Y,X→→Z,则X→→Y-Z, (3)函数依赖是多值依赖的特殊情况。 若X→Y,则X→→Y。 (4)若X→→Y,X→→Z,则X→→Y U Z。 (5)若X→→Y,X→→Z,则X→→Y∩Z。 (6)若X→→Y,X→→Z,则X→→Y-Z, X→→Z -Y。 2018年12月6日7时18分 周口师范学院计算机科学系

多值依赖与函数依赖的区别 (1) 有效性 多值依赖的有效性与属性集的范围有关 若X→→Y在U上成立,则在W(X Y  W  U)上一定成立;反之则不然,即X→→Y在W(W  U)上成立,在U上并不一定成立 多值依赖的定义中不仅涉及属性组 X和 Y,而且涉及U中其余属性Z。 一般地,在R(U)上若有X→→Y在W(W  U)上成立,则称X→→Y为R(U)的嵌入型多值依赖 2018年12月6日7时18分 周口师范学院计算机科学系

若函数依赖X→Y在R(U)上成立,则对于任何Y‘  Y均有X→Y’ 成立 只要在R(U)的任何一个关系r中,元组在X和Y上的值满足定义5.l(函数依赖), 则函数依赖X→Y在任何属性集W(X Y  W U)上成立。 (2) 若函数依赖X→Y在R(U)上成立,则对于任何Y‘  Y均有X→Y’ 成立 多值依赖X→→Y若在R(U)上成立,不能断言对于任何Y'  Y有X→→Y' 成立 2018年12月6日7时18分 周口师范学院计算机科学系

二、第四范式(4NF) 定义5.10 关系模式R<U,F>∈1NF,如果对于R的每个非平凡多值依赖X→→Y(Y  X),X都含有候选码,则R∈4NF。 (X→Y) 如果R ∈ 4NF, 则R ∈ BCNF 不允许有非平凡且非函数依赖的多值依赖 允许的是函数依赖(是非平凡多值依赖) 2018年12月6日7时18分 周口师范学院计算机科学系

存在非平凡的多值依赖C→→T,且C不是候选码 用投影分解法把Teach分解为如下两个关系模式: CT(C, T) ∈ 4NF 例: Teach(C,T,B) ∈ 4NF 存在非平凡的多值依赖C→→T,且C不是候选码 用投影分解法把Teach分解为如下两个关系模式: CT(C, T) ∈ 4NF CB(C, B) ∈ 4NF C→→T, C→→B是平凡多值依赖 2018年12月6日7时18分 周口师范学院计算机科学系

5.2.6 规范化 关系数据库的规范化理论是数据库逻辑设计的工具。 一个关系只要其分量都是不可分的数据项,它就是规范化的关系,但这只是最基本的规范化。 规范化程度可以有多个不同的级别 2018年12月6日7时18分 周口师范学院计算机科学系

规范化程度过低的关系不一定能够很好地描述现实世界,可能会存在插入异常、删除异常、修改复杂、数据冗余等问题 一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式集合,这种过程就叫关系模式的规范化 2018年12月6日7时18分 周口师范学院计算机科学系

关系模式规范化的基本步骤 1NF ↓ 消除非主属性对码的部分函数依赖 消除决定 2NF 属性集非 ↓ 消除非主属性对码的传递函数依赖 属性集非 ↓ 消除非主属性对码的传递函数依赖 属性凡函 3NF 数依赖 ↓ 消除主属性对码的部分和传递函数 依赖 BCNF ↓消除非平凡且非函数依赖的多值依 赖 4NF 2018年12月6日7时18分 周口师范学院计算机科学系

规范化的基本思想 消除不合适的数据依赖 各关系模式达到某种程度的“分离”采用“一事一地”的模式设计原则 让一个关系描述一个概念、一个实体或者实体间的一种联系。若多于一个概念就把它“分离”出去 所谓规范化实质上是概念的单一化 2018年12月6日7时18分 周口师范学院计算机科学系

在设计数据库模式结构时,必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适的、能够反映现实世界的模式 不能说规范化程度越高的关系模式就越好 在设计数据库模式结构时,必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适的、能够反映现实世界的模式 上面的规范化步骤可以在其中任何一步终止 2018年12月6日7时18分 周口师范学院计算机科学系

5.3 数据依赖的公理系统 逻辑蕴含 定义5.11 对于满足一组函数依赖 F 的关系模式R <U,F>,其任何一个关系r,若函数依赖X→Y都成立, 则称 F逻辑蕴含X →Y 2018年12月6日7时18分 周口师范学院计算机科学系

Armstrong公理系统 一套推理规则,是模式分解算法的理论基础 用途 求给定关系模式的码 从一组函数依赖求得蕴含的函数依赖 2018年12月6日7时18分 周口师范学院计算机科学系

1. Armstrong公理系统 关系模式R <U,F >来说有以下的推理规则: Al.自反律(Reflexivity): 若Y  X  U,则X →Y为F所蕴含。 A2.增广律(Augmentation):若X→Y为F所蕴含,且Z  U,则XZ→YZ为F所蕴含。 A3.传递律(Transitivity):若X→Y及Y→Z为F所蕴含,则X→Z为F所蕴含。 注意:由自反律所得到的函数依赖均是平凡的函数依赖,自反律的使用并不依赖于F 2018年12月6日7时18分 周口师范学院计算机科学系

定理 5.l Armstrong推理规则是正确的 (l)自反律:若Y  X  U,则X →Y为F所蕴含 证: 设Y  X  U 对R <U,F> 的任一关系r中的任意两个元组t,s: 若t[X]=s[X],由于Y  X,有t[y]=s[y], 所以X→Y成立. 自反律得证 2018年12月6日7时18分 周口师范学院计算机科学系

(2)增广律: 若X→Y为F所蕴含,且Z  U,则XZ→YZ 为F所蕴含。 证:设X→Y为F所蕴含,且Z  U。 设R<U,F> 的任一关系r中任意的两个元组t,s; 若t[XZ]=s[XZ],则有t[X]=s[X]和t[Z]=s[Z]; 由X→Y,于是有t[Y]=s[Y],所以t[YZ]=s[YZ],所以XZ→YZ为F所蕴含. 增广律得证。 2018年12月6日7时18分 周口师范学院计算机科学系

(3) 传递律:若X→Y及Y→Z为F所蕴含,则 X→Z为 F所蕴含。 证:设X→Y及Y→Z为F所蕴含。 对R<U,F> 的任一关系 r中的任意两 个元组 t,s。 若t[X]=s[X],由于X→Y,有 t[Y]=s[Y]; 再由Y→Z,有t[Z]=s[Z],所以X→Z为F 所蕴含. 传递律得证。 2018年12月6日7时18分 周口师范学院计算机科学系

2. 导出规则 1.根据A1,A2,A3这三条推理规则可以得到下面三条推理规则: 合并规则:由X→Y,X→Z,有X→YZ。 (A2, A3) 伪传递规则:由X→Y,WY→Z,有XW→Z。 (A2, A3) 分解规则:由X→Y及 ZY,有X→Z。 (A1, A3) 2018年12月6日7时18分 周口师范学院计算机科学系

引理5.l X→A1 A2…Ak成立的充分必要条件是X→Ai成立(i=l,2,…,k)。 2.根据合并规则和分解规则,可得引理5.1 引理5.l X→A1 A2…Ak成立的充分必要条件是X→Ai成立(i=l,2,…,k)。 2018年12月6日7时18分 周口师范学院计算机科学系

3. 函数依赖闭包 定义5.l2 在关系模式R<U,F>中为F所逻辑蕴含的函数依赖的全体叫作 F的闭包,记为F+。 定义5.13 设F为属性集U上的一组函数依赖,X U, XF+ ={ A|X→A能由F 根据Armstrong公理导 出}, XF+称为属性集X关于函数依赖集F 的闭包 2018年12月6日7时18分 周口师范学院计算机科学系

F的闭包 F={X → Y,Y → Z}, F+计算是NP完全问题,X → A1A2...An F+={ X → φ, Y → φ, Z → φ, XY → φ, XZ → φ, YZ → φ, XYZ → φ, X → X, Y → Y, Z → Z, XY → X, XZ → X, YZ → Y, XYZ → X, X → Y, Y → Z , XY → Y, XZ → Y, YZ → Z, XYZ → Y, X → Z, Y → YZ, XY → Z, XZ → Z, YZ → YZ, XYZ → Z, X → XY, XY → XY, XZ → XY, XYZ → XY, X → XZ, XY → YZ, XZ → XZ, XYZ → YZ X → YZ, XY → XZ, XZ → XY, XYZ → XZ, X → ZYZ, XY → XYZ, XZ → XYZ, XYZ → XYZ } 2018年12月6日7时18分 周口师范学院计算机科学系

关于闭包的引理 引理5.2 设F为属性集U上的一组函数依赖,X,Y  U,X→Y能由F 根据Armstrong公理导出的充分必要条件是Y XF+ 用途 将判定X→Y是否能由F根据Armstrong公理导出的问题, 就转化为求出XF+ ,判定Y是否为XF+的子集的问题 2018年12月6日7时18分 周口师范学院计算机科学系

求闭包的算法 算法5.l 求属性集X(X  U)关于U上的函 数依赖集F 的闭包XF+ 输入:X,F 输出:XF+ 步骤: (1)令X(0)=X,i=0 (2)求B,这里B = { A |( V)(  W)(V→WF ∧V  X(i)∧A W)}; (3)X(i+1)=B∪X(i) 2018年12月6日7时18分 周口师范学院计算机科学系

(5)若相等或X(i)=U , 则X(i)就是XF+ , 算法终止。 (6)若否,则 i=i+l,返回第(2)步。 (4)判断X(i+1)= X (i)吗? (5)若相等或X(i)=U , 则X(i)就是XF+ , 算法终止。 (6)若否,则 i=i+l,返回第(2)步。 对于算法5.l, 令ai =|X(i)|,{ai }形成一个步长大于1的严格递增的序列,序列的上界是 | U |,因 此该算法最多 |U| - |X| 次循环就会终止。 2018年12月6日7时18分 周口师范学院计算机科学系

Algorithm Define XF+ = closure of X = set of attributes functionally determined by X Basis: XF+ := X Induction: If Y  XF+, and Y → A is a given FD, then add A to XF+ End when XF+ cannot be changed. NEW X+ X+ Y A 2018年12月6日7时18分 周口师范学院计算机科学系

U={A, B, C, D}; F={A → B, BC → D}; A+ = AB. C+ = C. (AC)+ = ABCD. 2018年12月6日7时18分 周口师范学院计算机科学系

U={A, B, C, D}; A → B, BC → D. (AC)+ = ABCD. A C B D 2018年12月6日7时18分 周口师范学院计算机科学系

函数依赖闭包 [例1] 已知关系模式R<U,F>,其中 U={A,B,C,D,E}; F={AB→C,B→D,C→E,EC→B,AC→B}。 求(AB)F+ 。 解 设X(0)=AB; (1)计算X(1): 逐一的扫描F集合中各个函 数依赖,找左部为A,B或AB的函数 依赖。得到两个:AB→C,B→D。 于是X(1)=AB∪CD=ABCD。 2018年12月6日7时18分 周口师范学院计算机科学系

于是X(2)=X(1)∪BCDE=ABCDE。 (3)因为X(2)=U,算法终止 所以(AB)F+ =ABCDE。 AB→C,B→D, C→E,AC→B, 于是X(2)=X(1)∪BCDE=ABCDE。 (3)因为X(2)=U,算法终止 所以(AB)F+ =ABCDE。 2018年12月6日7时18分 周口师范学院计算机科学系

4. Armstrong公理系统的有效性与完备性 建立公理系统体系目的: 从已知的 f 推导出未知的f 明确: 1.公理系统推导出来的 f 正确? 2. F+中的每一个 f 都能推导出来? / f 不能由F 导出, f ∈ F+ 2018年12月6日7时18分 周口师范学院计算机科学系

有效性:由F出发根据Armstrong公理推导出 来的每一个函数依赖一定在F+中 /* Armstrong正确 若 f 不能用Armstrong公理推导出来, f∈ F+ 2018年12月6日7时18分 周口师范学院计算机科学系

有效性与完备性的证明 证明: 1. 有效性 可由定理5.l得证 2. 完备性 只需证明逆否命题: 若函数依赖 X→Y不能由F从Armstrong公理导 出,那么它必然不为F所蕴含 分三步证明: 2018年12月6日7时18分 周口师范学院计算机科学系

(1)引理: 若V→W成立,且V  XF+,则W  XF+ 证 因为 V  XF+ ,所以有X→V成立; 因为X →V,V→W,于是X→W成立 所以W  XF+ (2)/* 若 f 不能用Armstrong公理推导出来, f∈ F+ /* 若存在r, F+中的全部函数依赖在 r上成立。 /* 而不能用Armstrong公理推导出来的f , 在r上不成立。 构造一张二维表r,它由下列两个元组构成,可以证明r必是R(U,F)的一个关系,即F+中的全部函数依赖在 r上成立。 2018年12月6日7时18分 周口师范学院计算机科学系

XF+ U-XF+ 11......1 00......0   11......1 11......1   若r不是R<U,F> 的关系,则必由于F中有函数依赖V→W在r上不成立所致。由r的构成可知,V必定是XF+ 的子集,而W不是XF+ 的子集,可是由第(1)步,W  XF+,矛盾。所以r必是R<U,F>的一个关系。 2018年12月6日7时18分 周口师范学院计算机科学系

(3) /* 若 f 不能用Armstrong公理推导出 来, f∈ F+ /* 而不能用Armstrong公理推导出来的 f , 在r上不成立。 若X→Y 不能由F从Armstrong公理导出, 则Y 不是XF+ 的子集。(引理5.2) 因此必有Y 的子集Y’ 满足 Y’ U-XF+, 则X→Y在 r 中不成立,即X→Y必不为 R<U,F> 蕴含 /* 因为 F+中的全部函数依赖在 r上成立。 2018年12月6日7时18分 周口师范学院计算机科学系

Armstrong公理的完备性及有效性说明: “蕴含” == “导出” 等价的概念 “蕴含” == “导出” 等价的概念 F+ ==由F出发借助Armstrong公理导出的函数依赖的集合 2018年12月6日7时18分 周口师范学院计算机科学系

5. 函数依赖集等价 定义5.14 如果G+=F+,就说函数依赖集F覆盖G(F是G的覆盖,或G是F的覆盖),或F与G等价。 2018年12月6日7时18分 周口师范学院计算机科学系

函数依赖集等价的充要条件 引理5.3 F+ = G+ 的充分必要条件是 F  G+ ,和G  F+ 证: 必要性显然,只证充分性。 证: 必要性显然,只证充分性。 (1)若FG+ ,则XF+  XG++ 。 (2)任取X→YF+ 则有 Y  XF+  XG++ 。 所以X→Y  (G+)+= G+。即F+  G+。 (3)同理可证G+  F+ ,所以F+ = G+。 2018年12月6日7时18分 周口师范学院计算机科学系

函数依赖集等价 要判定F  G+,只须逐一对F中的函数依赖X→Y,考察 Y 是否属于XG++ 就行了。因此引理5.3 给出了判断两个函数依赖集等价的可行算法。 2018年12月6日7时18分 周口师范学院计算机科学系

6. 最小依赖集 定义5.15 如果函数依赖集F满足下列条件,则称F为一个极小函数依赖集。亦称为最小依赖集或最小覆盖。 (2) F中不存在这样的函数依赖X→A,使得F与 F-{X→A}等价。 (3) F中不存在这样的函数依赖X→A, X有真 子集Z使得F-{X→A}∪{Z→A}与F等价。 2018年12月6日7时18分 周口师范学院计算机科学系

[例2] 对于5.l节中的关系模式S<U,F>,其中: U={ SNO,SDEPT,MN,CNAME,G }, F={ SNO→SDEPT,SDEPT→MN, (SNO,CNAME)→G } 设F’={SNO→SDEPT,SNO→MN, SDEPT→MN,(SNO,CNAME)→G, (SNO,SDEPT)→SDEPT} F是最小覆盖,而F ’不是。 因为:F ’-{SNO→MN}与F ’等价 F ’-{(SNO,SDEPT)→SDEPT}也与F ’等价 F ’-{(SNO,SDEPT)→SDEPT} ∪{SNO→SDEPT}也与F ’等价 2018年12月6日7时18分 周口师范学院计算机科学系

7. 极小化过程 定理5.3 每一个函数依赖集F均等价于一个极 函数依赖集Fm。此Fm称为F的最小依赖集 (1)逐一检查F中各函数依赖FDi:X→Y, 若Y=A1A2 …Ak,k > 2, 则用 { X→Aj |j=1,2,…, k} 来取代X→Y 引理5.1保证了F变换前后的等价性 2018年12月6日7时18分 周口师范学院计算机科学系

(2)逐一检查F中各函数依赖FDi:X→A, 令G=F-{X→A}, 若AXG+, 则从F中去掉此函数依赖。 由于F与G =F-{X→A}等价的充要条件是AXG+ 因此F变换前后是等价的。 2018年12月6日7时18分 周口师范学院计算机科学系

(3)逐一取出F中各函数依赖FDi:X→A, 设X=B1B2…Bm, 逐一考查Bi (i=l,2,…,m), 若A (X-Bi )F+ , 则以X-Bi 取代X。 由于F与F-{X→A}∪{Z→A}等价的充要条件是AZF+ ,其中Z=X-Bi 因此F变换前后是等价的。 2018年12月6日7时18分 周口师范学院计算机科学系

由定义,最后剩下的F就一定是极小依赖集。 因为对F的每一次“改造”都保证了改造前后的两个函数依赖集等价,因此剩下的F与原来的F等价。 证毕 2018年12月6日7时18分 周口师范学院计算机科学系

极小化过程 [例3] F = {A→B,B→A,B→C, A→C,C→A} Fm1、Fm2都是F的最小依赖集: Fm1= {A→B,B→C,C→A}   Fm2= {A→B,B→A,A→C,C→A} F的最小依赖集Fm不一定是唯一的它与对各函数依赖FDi 及X→A中X各属性的处置顺序有关 2018年12月6日7时18分 周口师范学院计算机科学系

极小化过程( 定理5.3的证明 )也是检验F是否为极小依赖集的一个算法 若改造后的F与原来的F相同,说明F本身就是一个最小依赖集 2018年12月6日7时18分 周口师范学院计算机科学系

在R<U,F>中可以用与F等价的依赖集G来取代F 原因:两个关系模式R1 <U,F>,R2<U,G>,如果F与G等价,那么R1的关系一定是R2的关系。反过来,R2的关系也一定是R1的关系。 2018年12月6日7时18分 周口师范学院计算机科学系

5.4 模式的分解 把低一级的关系模式分解为若干个高一级的关系模式的方法并不是唯一的 只有能够保证分解后的关系模式与原关系模式等价,分解方法才有意义 2018年12月6日7时18分 周口师范学院计算机科学系

关系模式分解的标准 三种模式分解的等价定义 ⒈ 分解具有无损连接性 ⒉ 分解要保持函数依赖 ⒊ 分解既要保持函数依赖,又要具有无损连接性 2018年12月6日7时18分 周口师范学院计算机科学系

定义5.16 关系模式R<U,F>的一个分解: ρ={ R1<U1,F1>,R2<U2,F2>,…,Rn<Un,Fn>} U=U1∪U2∪…∪Un,且不存在 Ui  Uj,Fi 为 F在 Ui 上的投影 定义5.17 函数依赖集合{X→Y | X→Y  F+∧XY Ui} 的一个覆盖 Fi 叫作 F 在属性 Ui 上的投影 2018年12月6日7时18分 周口师范学院计算机科学系

例: SL(Sno, Sdept, Sloc) F={ Sno→Sdept,Sdept→Sloc,Sno→Sloc} SL∈2NF 存在插入异常、删除异常、冗余度大和修改复杂等问题 分解方法可以有多种 2018年12月6日7时18分 周口师范学院计算机科学系

95005 PH B ────────────────── SL ────────────────── Sno Sdept Sloc 95001 CS A 95002 IS B 95003 MA C 95004 IS B 95005 PH B ────────────────── 2018年12月6日7时18分 周口师范学院计算机科学系

1. SL分解为下面三个关系模式: SN(Sno) SD(Sdept) SO(Sloc) 2018年12月6日7时18分 周口师范学院计算机科学系

分解后的关系为: SN ─── SD ──── SO ──── Sno Sdept Sloc ──── ──── ──── ──── ──── ──── 95001 CS A 95002 IS B 95003 MA C 95004 PH ─── 95005 ───── ──── 2018年12月6日7时18分 周口师范学院计算机科学系

例如无法查询95001学生所在系或所在宿舍。如果分解后的关系可以通过自然连接恢复为原来的关系,那么这种分解就没有丢失信息 分解后的数据库丢失了许多信息 例如无法查询95001学生所在系或所在宿舍。如果分解后的关系可以通过自然连接恢复为原来的关系,那么这种分解就没有丢失信息 2018年12月6日7时18分 周口师范学院计算机科学系

2. SL分解为下面二个关系模式: NL(Sno, Sloc) DL(Sdept, Sloc) 分解后的关系为: NL ────── DL ─────── Sno Sloc Sdept Sloc ────── ─────── 95001 A CS A 95002 B IS B 95003 C MA C 95004 B PH B 95005 B ─────── ─────── 2018年12月6日7时18分 周口师范学院计算机科学系

NL DL ───────────── Sno Sloc Sdept ───────────── 95001 A CS 95002 B IS 95002 B PH 95003 C MA 95004 B IS 95004 B PH 95005 B IS 95005 B PH 2018年12月6日7时18分 周口师范学院计算机科学系

NL DL比原来的SL关系多了3个元组 无法知道95002、95004、95005 究竟是哪个系的学生 元组增加了,信息丢失了 2018年12月6日7时18分 周口师范学院计算机科学系

第三种分解方法 3. 将SL分解为下面二个关系模式: ND(Sno, Sdept) NL(Sno, Sloc) 分解后的关系为: ND ────── NL ────── Sno Sdept Sno Sloc ────── ─────── 95001 CS 95001 A 95002 IS 95002 B 95003 MA 95003 C 95004 IS 95004 B 95005 PH 95005 B ──────── ─────── 2018年12月6日7时18分 周口师范学院计算机科学系

ND NL ──────────── Sno Sdept Sloc ──────────── 95001 CS A 95002 IS B 95003 MA C 95004 CS A 95005 PH B ───────────── 与SL关系一样,因此没有丢失信息 2018年12月6日7时18分 周口师范学院计算机科学系

具有无损连接性的模式分解 关系模式R<U,F>的一个分解 ρ={ R1<U1,F1>,R2<U2,F2>, …,Rn<Un,Fn>} 若R与R1、R2、…、Rn自然连接的结果相等,则称关系模式R的这个分解ρ具有无损连接性(Lossless join) 具有无损连接性的分解保证不丢失信息 无损连接性不一定能解决插入异常、删除异常、修改复杂、数据冗余等问题 2018年12月6日7时18分 周口师范学院计算机科学系

第三种分解方法具有无损连接性 问题: 这种分解方法没有保持原关系中的函数依赖 SL中的函数依赖Sdept→Sloc 没有投影到关系模式ND、NL上 2018年12月6日7时18分 周口师范学院计算机科学系

保持函数依赖的模式分解 设关系模式R<U,F>被分解为若干个关系模式 R1<U1,F1>,R2<U2,F2>,…,Rn<Un,Fn> (其中U=U1∪U2∪…∪Un,且不存在Ui  Uj,Fi为F在Ui上的投影),若F所逻辑蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖Fi所逻辑蕴含,则称关系模式R的这个分解是保持函数依赖的(Preserve dependency)。 2018年12月6日7时18分 周口师范学院计算机科学系

第四种分解方法 将SL分解为下面二个关系模式: ND(Sno, Sdept) DL(Sdept, Sloc) 这种分解方法就保持了函数依赖。 2018年12月6日7时18分 周口师范学院计算机科学系

如果一个分解具有无损连接性,则它能够保证不丢失信息。 如果一个分解保持了函数依赖,则它可以减轻或解决各种异常情况。 分解具有无损连接性和分解保持函数依赖是两个互相独立的标准。具有无损连接性的分解不一定能够保持函数依赖。同样,保持函数依赖的分解也不一定具有无损连接性。 2018年12月6日7时18分 周口师范学院计算机科学系

第一种分解方法既不具有无损连接性,也未保持函数依赖,它不是原关系模式的一个等价分解 第二种分解方法保持了函数依赖,但不具有无损连接性 第三种分解方法具有无损连接性,但未持函数依赖 第四种分解方法既具有无损连接性,又保持了函数依赖 2018年12月6日7时18分 周口师范学院计算机科学系

分解算法 算法5.2 判别一个分解的无损连接性 算法5.3 (合成法)转换为3NF的保持函数依赖的分解。 算法5.2 判别一个分解的无损连接性 算法5.3 (合成法)转换为3NF的保持函数依赖的分解。 算法5.4 转换为3NF既有无损连接性又保持函数依赖的分解 算法5.5 转换为BCNF的无损连接分解(分解法) 算法5.6 达到4NF的具有无损连接性的分 解P196 图5 .11 2018年12月6日7时18分 周口师范学院计算机科学系

若要求分解具有无损连接性,那么模式分解一定能够达到4NF。 解P196 图5 .11 若要求分解具有无损连接性,那么模式分解一定能够达到4NF。 若要求分解保持函数依赖,那么模式分解一定能够达到3NF,但不一定能够达到BCNF。 若要求分解既具有无损连接性,又保持函数依赖,则模式分解一定能够达到3NF,但不一定能够达到BCNF。 2018年12月6日7时18分 周口师范学院计算机科学系

泛关系假设 “假设已知一个模式Sφ,它仅由单个关系模式组成,问题是要设计一个模式SD,它与Sφ‘等价’,但在某些方面更好一些” 从一个关系模式出发,而不是从一组关系模式出发实行分解 “等价”的定义也是一组关系模式与一个关系模式的“等价” 2018年12月6日7时18分 周口师范学院计算机科学系

小结 规范化理论为数据库设计提供了理论的指南和工具 也仅仅是指南和工具 并不是规范化程度越高,模式就越好 必须结合应用环境和现实世界的具体情况合理地选择数据库模式 2018年12月6日7时18分 周口师范学院计算机科学系