An Introduction to Database System An Introduction to Database System

Slides:



Advertisements
Similar presentations
1.2 偏导数与全微分 偏导数的概念 解 偏导数的求法(类似一元函数) ( 1 )固定一个变量,对另一个变量用一元函 数的公式法则求导.
Advertisements

2010 年 6 月课件制作人:王亚楠 1 模块 2 项目开发概论 教学课件 年 6 月课件制作人:王亚楠 2 目录 目标 了解:数据库技术的基本概念与结构 理解:数据模型的分类与结构组成 掌握:关系数据库及 SQL 的基本理论 知识 掌握:数据库设计的方法与步骤 内容 2.1 数据库技术基础.
人的性别遗传 合肥市第四十九中学 丁 艳. 男女成对染色体排序图 1 、男性和女性各 23 对染色体有何异同 ? 哪 一对被称为性染色体 ? 2 、这两幅图中,哪幅 图显示的是男性的染色 体?哪幅图显示的是女 性染色体? 3 、图中哪条染色体是 Y 染色体?它与 X 染色体 在形态上的主要区别是.
Visual FoxPro 教程 淮海工学院计算机工程学院 巫晓琳.
1、一般地说,在生物的体细胞中, 和 都是成对存在的。
辨性别 A B. 辨性别 A B 第三节人类染色体与性别决定 昌邑市龙池初中 杨伟红 学习目标 1.理解人的染色体组成和传递规律。 2.解释人类性别决定的原理。 3.通过探究活动,解读数据了解生男生女的比例。
性别决定与伴性遗传 性别决定 伴性遗传 巩固练习.
4.3 磁場內的載電流導體 電池車 作用於載電流導體的力 進度評估 5 進度評估 6 應用:電動機 進度評估 7
An Introduction to Database System
第六章 数据库设计.
第2章 数据模型 本章学习要求: 1. 层次数据模型、网状数据模型 了解层次及网状数据模型的基本概念和结构。 2. 关系数据模型
《陈情表》 (晋 李密) 那大中学语文组何杰.
《旅游文化》项目二 姓氏称谓避讳 宁波东钱湖旅游学校.
第七章:数据库设计理论基础.
第3章 关系数据库的基本理论 冯万利.
Principles and Applications of the Database
第4章 关系数据库设计理论 本章内容 4.1 问题的提出 4.2 规范化 4.3 数据依赖的公理系统* 4.4 小结 习 题.
跳楼价 亏本大甩卖 清仓处理 买一送一 5折酬宾. 跳楼价 亏本大甩卖 清仓处理 买一送一 5折酬宾.
清仓处理 跳楼价 满200返160 5折酬宾.
Xiàn lù zuàn 陷入 忙碌 攥着.
软件设计师培训.
计算机应用基础 上海大学计算中心.
第六章 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解.
An Introduction to Database System
色 弱 與 色 盲.
Database Principles & Applications
陈情表 李密.
数据库原理 Database Principles 第五章 数据库完整性 Database Principles.
宠物之家 我的宠物性别? 雌(♀) or 雄(♂) 第一阶段:我的宠物我做主 第二阶段:宠物“相亲记” 第三阶段:家族诞生
第20章 生物的遗传和变异 第四节 性别和性别决定 淮南二十六中 鲍娟娟. 第20章 生物的遗传和变异 第四节 性别和性别决定 淮南二十六中 鲍娟娟.
第4章 数据库技术及应用 软件开发技术基础 计算机教学实验中心 2006.
An Introduction to Database System An Introduction To Database System
你一定要認識的數學家.
第四章 关系数据理论 4.1 关系模式的设计问题 4.2 关系模式的规范化 4.3 数据依赖的公理系统 4.4 关系模式的分解 本章小结.
數位邏輯簡介.
課程名稱:資料庫系統 授課老師:李春雄 博士
課程名稱:資料庫系統 授課老師:李春雄 博士
第7章 關聯式資料庫的正規化 7-1 正規化的基礎 7-2 功能相依 7-3 第一階到第三階正規化型式 7-4 多重值相依與第四階正規化型式
1、掌握为什么不合适的关系模式会带来插入异常、删除异常、 存储异常、修改困难等严重问题 2、深刻理解函数依赖、多值依赖等有关概念
教 师:曾晓东 电 话: 数据库技术 教 师:曾晓东 电 话:
第四章关系数据库设计理论 4.1 数据依赖 4.2 范式 4.3 关系模式的规范化.
正規化 Normalization.
CH06 正規化概述.
Chapter 3 正規化與各種合併.
資料庫簡介 郭士煒 助教.
表格正規化簡介 講授大綱: 第一正規化 資料表的切割 第二正規化 第三正規化 Boyce/Codd正規化 第四正規化 第五正規化
台大工程科學及海洋工程所應用力學組碩士論文口試 研究生:吳明宗 指導教授:陳永祥
30 利用畢氏定理,計算下列各直角三角形中, 未知邊長 x 的值: (1) x2+( )2=( )2 x= 因為 x>0, 所以 x=3。
Thanks for the Slides from Renmin U
第五章 关系数据理论 关系模型有严格的数学理论基础,也是目前应用最广泛的数据模型,关系规范化是指导数据库设计的重要理论。一个好的关系数据库是应该既可以供人们方便地获取信息,而又不产生过多的不必要的重复存储问题。可以说,规范化理论是数据模型优化的理论基础,对其他数据库的逻辑设计同样具有理论上的意义。 2018年12月6日7时18分.
国家“十一五”规划教材 数据库原理与应用教程(第3版).
SQL SERVER 一些经典语句 1.
An Introduction to Database System An Introduction to Database System
Database Systems Design Part III : Normalization
皇帝的新装 知识窗口 整体感知 合作探究 总结提高 创新发展. 皇帝的新装 知识窗口 整体感知 合作探究 总结提高 创新发展.
第七章 求极值及解线性规划问题命令与例题.
二元一次聯立方程式 代入消去法 加減消去法 自我評量.
第二部分 集合论 第六章 集合代数 主要内容 集合的基本概念 属于、包含 幂集、空集 文氏图等 集合的基本运算 并、交、补、差等 集合恒等式
數學少林寺 因式分解 寺址:新竹縣立中正國民中學 長老:林永章、廖玉真.
指数 对数 指数 幂函数举例 对数 幂函数举例.
利用平方差公式因式分解 利用和的平方公式因式分解 利用差的平方公式因式分解 綜合運用
C ( )下圖有 4 個邊長為 x 的正方形,4 個 長為 x、寬為 1 的長方形,以及 1 個 邊長為1 的正方形,則這 9 個圖形的
分 解 因 式 保定市第二十六中学 刘彦莉.
連比 連比例式的應用 自我評量.
第3章 关系数据库 内容提要 关系模型的数据结构 关系模型的常用术语 关系数据库的完整性概念 数据库的关系运算 函数依赖的定义
第八章 服務部門成本分攤.
第五章关系数据库设计理论 5.1 数据依赖 5.2 范式 5.3 关系模式的规范化.
第二章 一元一次不等式和一元一次不等式组 回顾与复习(一).
 3.1.4 空间向量的正交分解及其坐标表示.
大綱: 比例線段定義 平行線截比例線段性質 顧震宇 台灣數位學習科技股份有限公司
Presentation transcript:

An Introduction to Database System An Introduction to Database System 数据库系统概论 An Introduction to Database System 第六章 关系数据理论 中国人民大学信息学院 An Introduction to Database System

An Introduction to Database System 第六章 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解 6.5 小结 An Introduction to Database System

An Introduction to Database System 6.1 问题的提出 关系数据库逻辑设计 针对具体问题,如何构造一个适合于它的数据模式 数据库逻辑设计的工具──关系数据库的规范化理论 An Introduction to Database System

An Introduction to Database System 问题的提出 一、概念回顾 二、关系模式的形式化定义 三、什么是数据依赖 四、关系模式的简化定义 五、数据依赖对关系模式影响 An Introduction to Database System

An Introduction to Database System 一、概念回顾 关系 关系模式 关系数据库 关系数据库的模式 An Introduction to Database System

An Introduction to Database System 二、关系模式的形式化定义 关系模式由五部分组成,即它是一个五元组: R(U, D, DOM, F) R: 关系名 U: 组成该关系的属性名集合 D: 属性组U中属性所来自的域 DOM: 属性向域的映象集合 F: 属性间数据的依赖关系集合 An Introduction to Database System

An Introduction to Database System 三、什么是数据依赖 1. 完整性约束的表现形式 限定属性取值范围:例如学生成绩必须在0-100之间 定义属性值间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键 An Introduction to Database System

An Introduction to Database System 什么是数据依赖(续) 2. 数据依赖 一个关系内部属性与属性之间的约束关系 现实世界属性间相互联系的抽象 数据内在的性质 语义的体现 An Introduction to Database System

An Introduction to Database System 什么是数据依赖(续) 3. 数据依赖的类型 函数依赖(Functional Dependency,简记为FD) 多值依赖(Multivalued Dependency,简记为MVD) 其他 An Introduction to Database System

An Introduction to Database System 四、关系模式的简化表示 关系模式R(U, D, DOM, F) 简化为一个三元组: R(U, F) 当且仅当U上的一个关系r满足F时,r称为关系模式 R(U, F)的一个关系 An Introduction to Database System

An Introduction to Database System 五、数据依赖对关系模式的影响 [例1]建立一个描述学校教务的数据库: 学生的学号(Sno)、所在系(Sdept) 系主任姓名(Mname)、课程名(Cname) 成绩(Grade) 单一的关系模式 : Student <U、F> U ={ Sno, Sdept, Mname, Cname, Grade } An Introduction to Database System

An Introduction to Database System 数据依赖对关系模式的影响(续) 属性组U上的一组函数依赖F: F ={ Sno → Sdept, Sdept → Mname, (Sno, Cname) → Grade } Sno Cname Sdept Mname Grade An Introduction to Database System

关系模式Student<U, F>中存在的问题 1. 数据冗余太大 2. 更新异常(Update Anomalies) 3. 插入异常(Insertion Anomalies) 4. 删除异常(Deletion Anomalies) An Introduction to Database System

An Introduction to Database System 数据依赖对关系模式的影响(续) 结论: Student关系模式不是一个好的模式。 “好”的模式: 不会发生插入异常、删除异常、更新异常, 数据冗余应尽可能少 原因:由存在于模式中的某些数据依赖引起的 解决方法:通过分解关系模式来消除其中不合适 的数据依赖 An Introduction to Database System

An Introduction to Database System 分解关系模式 把这个单一模式分成3个关系模式: S(Sno,Sdept,Sno → Sdept); SC(Sno,Cno,Grade,(Sno,Cno) → Grade); DEPT(Sdept,Mname,Sdept→ Mname) An Introduction to Database System

An Introduction to Database System 第六章 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解 6.5 小结 An Introduction to Database System

An Introduction to Database System 6.2 规范化 规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。 An Introduction to Database System

An Introduction to Database System 6.2 规范化 6.2.1 函数依赖 6.2.2 码 6.2.3 范式 6.2.4 2NF 6.2.5 3NF 6.2.6 BCNF 6.2.7 多值依赖 6.2.8 4NF 6.2.9 规范化小结 An Introduction to Database System

An Introduction to Database System 6.2.1 函数依赖 函数依赖 平凡函数依赖与非平凡函数依赖 完全函数依赖与部分函数依赖 传递函数依赖 An Introduction to Database System

An Introduction to Database System 一、函数依赖 定义6.1 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。 若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作X→Y。 An Introduction to Database System

An Introduction to Database System 说明 1. 所有关系实例均要满足 2. 语义范畴的概念 3. 数据库设计者可以对现实世界作强制的规定 An Introduction to Database System

An Introduction to Database System 二、平凡函数依赖与非平凡函数依赖 在关系模式R(U)中,对于U的子集X和Y, 如果X→Y,但Y  X,则称X→Y是非平凡的函数依赖 若X→Y,但Y  X, 则称X→Y是平凡的函数依赖 例:在关系SC(Sno, Cno, Grade)中, 非平凡函数依赖: (Sno, Cno) → Grade 平凡函数依赖: (Sno, Cno) → Sno (Sno, Cno) → Cno An Introduction to Database System

An Introduction to Database System 平凡函数依赖与非平凡函数依赖(续) 若X→Y,则X称为这个函数依赖的决定属性组,也称为决定因素(Determinant)。 若X→Y,Y→X,则记作X←→Y。 若Y不函数依赖于X,则记作X→Y。 An Introduction to Database System

An Introduction to Database System 三、完全函数依赖与部分函数依赖 定义6.2 在R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有X’ Y, 则称Y对X完全函数依赖,记作 X F Y。 若X→Y,但Y不完全函数依赖于X,则称Y对X部分函数依赖,记作X P Y。 An Introduction to Database System

An Introduction to Database System 完全函数依赖与部分函数依赖(续) [例1] 中(Sno,Cno)→Grade是完全函数依赖, (Sno,Cno)→Sdept是部分函数依赖 因为Sno →Sdept成立,且Sno是(Sno,Cno)的真子集 F P An Introduction to Database System

An Introduction to Database System 四、传递函数依赖 定义6.3 在R(U)中,如果X→Y,(Y X) ,Y→X Y→Z, 则称Z对X传递函数依赖。 记为:X → Z 注: 如果Y→X, 即X←→Y,则Z直接依赖于X。 例: 在关系Std(Sno, Sdept, Mname)中,有: Sno → Sdept,Sdept → Mname Mname传递函数依赖于Sno 传递 An Introduction to Database System

An Introduction to Database System 6.2 规范化 6.2.1 函数依赖 6.2.2 码 6.2.3 范式 6.2.4 2NF 6.2.5 3NF 6.2.6 BCNF 6.2.7 多值依赖 6.2.8 4NF 6.2.9 规范化小结 An Introduction to Database System

An Introduction to Database System 6.2.2 码 定义6.4 设K为R<U,F>中的属性或属性组合。若K U, 则K称为R的侯选码(Candidate Key)。 若候选码多于一个,则选定其中的一个做为主码(Primary Key)。 F An Introduction to Database System

An Introduction to Database System 码(续) 主属性与非主属性 包含在任何一个候选码中的属性 ,称为主属性(Prime attribute) 不包含在任何码中的属性称为非主属性(Nonprime attribute)或非码属性(Non-key attribute) 全码 整个属性组是码,称为全码(All-key) An Introduction to Database System

An Introduction to Database System 码(续) [例2] 关系模式S(Sno,Sdept,Sage),单个属性Sno是码, SC(Sno,Cno,Grade)中,(Sno,Cno)是码 [例3] 关系模式R(P,W,A) P:演奏者 W:作品 A:听众 一个演奏者可以演奏多个作品 某一作品可被多个演奏者演奏 听众可以欣赏不同演奏者的不同作品 码为(P,W,A),即All-Key An Introduction to Database System

An Introduction to Database System 外部码 定义6.5 关系模式 R 中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign key)也称外码 如在SC(Sno,Cno,Grade)中,Sno不是码,但Sno是关系模式S(Sno,Sdept,Sage)的码,则Sno是关系模式SC的外部码 主码与外部码一起提供了表示关系间联系的手段 An Introduction to Database System

An Introduction to Database System 6.2 规范化 6.2.1 函数依赖 6.2.2 码 6.2.3 范式 6.2.4 2NF 6.2.5 3NF 6.2.6 BCNF 6.2.7 多值依赖 6.2.8 4NF 6.2.9 规范化小结 An Introduction to Database System

An Introduction to Database System 6.2.3 范式 范式是符合某一种级别的关系模式的集合 关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式 范式的种类: 第一范式(1NF) 第二范式(2NF) 第三范式(3NF) BC范式(BCNF) 第四范式(4NF) 第五范式(5NF) An Introduction to Database System

An Introduction to Database System 6.2.3 范式 各种范式之间存在联系: 某一关系模式R为第n范式,可简记为R∈nNF。 一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化 An Introduction to Database System

An Introduction to Database System 6.2 规范化 6.2.1 函数依赖 6.2.2 码 6.2.3 范式 6.2.4 2NF 6.2.5 3NF 6.2.6 BCNF 6.2.7 多值依赖 6.2.8 4NF 6.2.9 规范化小结 An Introduction to Database System

An Introduction to Database System 6.2.4 2NF 1NF的定义 如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF 第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库 但是满足第一范式的关系模式并不一定是一个好的关系模式 An Introduction to Database System

An Introduction to Database System 2NF(续) [例4] 关系模式 S-L-C(Sno, Sdept, Sloc, Cno, Grade) Sloc为学生住处,假设每个系的学生住在同一个地方 函数依赖包括: (Sno, Cno) F Grade Sno → Sdept (Sno, Cno) P Sdept Sno → Sloc (Sno, Cno) P Sloc Sdept → Sloc An Introduction to Database System

An Introduction to Database System 2NF(续) S-L-C Sno Sdept S-L-C的码为(Sno, Cno) S-L-C满足第一范式。 非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno) Grade Cno Sloc An Introduction to Database System

An Introduction to Database System S-L-C不是一个好的关系模式(续) (1) 插入异常 (2) 删除异常 (3) 数据冗余度大 (4) 修改复杂 An Introduction to Database System

An Introduction to Database System S-L-C不是一个好的关系模式(续) 原因 Sdept、 Sloc部分函数依赖于码。 解决方法 S-L-C分解为两个关系模式,以消除这些部分函数依赖 SC(Sno, Cno, Grade) S-L(Sno, Sdept, Sloc) An Introduction to Database System

An Introduction to Database System 2NF(续) 函数依赖图: S-L Sno Sdept Sloc Sno Cno Grade SC 关系模式SC的码为(Sno,Cno) 关系模式S-L的码为Sno 这样非主属性对码都是完全函数依赖 An Introduction to Database System

An Introduction to Database System 2NF(续) 2NF的定义 定义6.6 若R∈1NF,且每一个非主属性完全函数依赖于码,则R∈2NF。 例:S-L-C(Sno, Sdept, Sloc, Cno, Grade) ∈1NF S-L-C(Sno, Sdept, Sloc, Cno, Grade) ∈2NF SC(Sno, Cno, Grade) ∈ 2NF S-L(Sno, Sdept, Sloc) ∈ 2NF An Introduction to Database System

An Introduction to Database System 2NF(续) 采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。 An Introduction to Database System

An Introduction to Database System 6.2 规范化 6.2.1 函数依赖 6.2.2 码 6.2.3 范式 6.2.4 2NF 6.2.5 3NF 6.2.6 BCNF 6.2.7 多值依赖 6.2.8 4NF 6.2.9 规范化小结 An Introduction to Database System

An Introduction to Database System 6.2.5 3NF 3NF的定义 定义6.7 关系模式R<U,F> 中若不存在这样的码X、属性组Y及非主属性Z(Z  Y), 使得X→Y,Y→Z成立, Y → X,则称R<U,F> ∈ 3NF。 若R∈3NF,则每一个非主属性既不部分依赖于码也不传递依赖于码。 An Introduction to Database System

An Introduction to Database System 3NF(续) 例:2NF关系模式S-L(Sno, Sdept, Sloc)中 函数依赖: Sno→Sdept Sdept → Sno Sdept→Sloc 可得: Sno→Sloc,即S-L中存在非主属性对码的传递函数依 赖,S-L ∈ 3NF 传递 An Introduction to Database System

An Introduction to Database System 3NF(续) 函数依赖图: S-L Sno Sdept Sloc An Introduction to Database System

An Introduction to Database System 3NF(续) 解决方法 采用投影分解法,把S-L分解为两个关系模式,以消除传递函数依赖: S-D(Sno, Sdept) D-L(Sdept,Sloc) S-D的码为Sno, D-L的码为Sdept。 分解后的关系模式S-D与D-L中不再存在传递依赖 An Introduction to Database System

An Introduction to Database System 3NF(续) S-D的码为Sno, D-L的码为Sdept Sno Sdept S-D Sloc D-L S-L(Sno, Sdept, Sloc) ∈ 2NF S-L(Sno, Sdept, Sloc) ∈ 3NF S-D(Sno,Sdept) ∈ 3NF D-L(Sdept, Sloc)∈ 3NF An Introduction to Database System

An Introduction to Database System 3NF(续) 采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个2NF关系分解为多个3NF的关系后,仍然不能完全消除关系模式中的各种异常情况和数据冗余。 An Introduction to Database System

An Introduction to Database System 6.2 规范化 6.2.1 函数依赖 6.2.2 码 6.2.3 范式 6.2.4 2NF 6.2.5 3NF 6.2.6 BCNF 6.2.7 多值依赖 6.2.8 4NF 6.2.9 规范化小结 An Introduction to Database System

An Introduction to Database System 6.2.6 BC范式(BCNF) 定义6.8 关系模式R<U,F>∈1NF,若X→Y且Y  X时X必含有码,则R<U,F> ∈BCNF。 等价于:每一个决定属性因素都包含码 An Introduction to Database System

An Introduction to Database System BCNF(续) 若R∈BCNF 所有非主属性对每一个码都是完全函数依赖 所有的主属性对每一个不包含它的码,也是完全函数依赖 没有任何属性完全函数依赖于非码的任何一组属性 R ∈BCNF R ∈3NF 充分 不必要 An Introduction to Database System

An Introduction to Database System BCNF(续) [例5] 关系模式C(Cno,Cname,Pcno) C∈3NF C∈BCNF [例6] 关系模式S(Sno,Sname,Sdept,Sage) 假定S有两个码Sno,Sname S∈3NF。 S ∈ BCNF An Introduction to Database System

An Introduction to Database System BCNF(续) [例7]关系模式SJP(S,J,P) 函数依赖:(S,J)→P;(J,P)→S (S,J)与(J,P)都可以作为候选码,属性相交 SJP∈3NF, SJP∈BCNF An Introduction to Database System

An Introduction to Database System BCNF(续) [例8]在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。 函数依赖: (S,J)→T,(S,T)→J,T→J (S,J)和(S,T)都是候选码 An Introduction to Database System

An Introduction to Database System BCNF(续) S J T STJ中的函数依赖 J An Introduction to Database System

An Introduction to Database System BCNF(续) STJ∈3NF  没有任何非主属性对码传递依赖或部分依赖  STJ∈BCNF T是决定因素,T不包含码 An Introduction to Database System

An Introduction to Database System BCNF(续) 解决方法:将STJ分解为二个关系模式: ST(S,T) ∈ BCNF, TJ(T,J)∈ BCNF 没有任何属性对码的部分函数依赖和传递函数依赖 S J ST T TJ An Introduction to Database System

An Introduction to Database System 3NF与BCNF的关系 R ∈BCNF R ∈3NF 如果R∈3NF,且R只有一个候选码 充分 不必要 充分 必要 An Introduction to Database System

An Introduction to Database System 6.2 规范化 6.2.1 函数依赖 6.2.2 码 6.2.3 范式 6.2.4 2NF 6.2.5 3NF 6.2.6 BCNF 6.2.7 多值依赖 6.2.8 4NF 6.2.9 规范化小结 An Introduction to Database System

An Introduction to Database System 6.2.7 多值依赖 [例9] 学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。每个教员可以讲授多门课程,每种参考书可以供多门课程使用。 An Introduction to Database System

An Introduction to Database System 多值依赖(续) 非规范化关系 课 程 C 教 员 T 参 考 书 B   物理 数学 计算数学 李 勇 王 军    张 平 周 峰 普通物理学 光学原理 物理习题集 数学分析 微分方程 高等代数 ... …   … … … An Introduction to Database System

An Introduction to Database System 多值依赖(续) 用二维表表示Teaching 普通物理学 光学原理 物理习题集 数学分析 微分方程 高等代数 … 李 勇 王 军 张 平 物 理 数 学 参考书B 教员T 课程C An Introduction to Database System

An Introduction to Database System 多值依赖(续) Teaching∈BCNF Teaching具有唯一候选码(C,T,B), 即全码 An Introduction to Database System

An Introduction to Database System 多值依赖(续) Teaching模式中存在的问题 (1)数据冗余度大 (2)插入操作复杂 (3) 删除操作复杂 (4) 修改操作复杂 存在 多值依赖 An Introduction to Database System

An Introduction to Database System 多值依赖(续) 定义6.9 设R(U)是一个属性集U上的一个关系模式, X、 Y和Z是U的子集,并且Z=U-X-Y。关系模式R(U)中多值依赖 X→→Y成立,当且仅当对R(U)的任一关系r,给定的一对(x,z)值,有一组Y的值,这组值仅仅决定于x值而与z值无关 例 Teaching(C, T, B) An Introduction to Database System

An Introduction to Database System 多值依赖(续) 多值依赖的另一个等价的形式化的定义: 在R(U)的任一关系r中,如果存在元组t,s 使得t[X]=s[X],那么就必然存在元组 w,v r,(w,v可以与s,t相同),使得w[X]=v[X]=t[X],而w[Y]=t[Y],w[Z]=s[Z],v[Y]=s[Y],v[Z]=t[Z](即交换s,t元组的Y值所得的两个新元组必在r中),则Y多值依赖于X,记为X→→Y。 这里,X,Y是U的子集,Z=U-X-Y。 An Introduction to Database System

An Introduction to Database System 多值依赖(续) 平凡多值依赖和非平凡的多值依赖 若X→→Y,而Z=φ,则称 X→→Y为平凡的多值依赖 否则称X→→Y为非平凡的多值依赖 An Introduction to Database System

An Introduction to Database System 多值依赖(续) [例10]关系模式WSC(W,S,C) W表示仓库,S表示保管员,C表示商品 假设每个仓库有若干个保管员,有若干种商品 每个保管员保管所在的仓库的所有商品 每种商品被所有保管员保管 An Introduction to Database System

An Introduction to Database System 多值依赖(续) W S C W1 S1 C1 C2 C3 S2 W2 S3 C4 C5 S4 An Introduction to Database System

An Introduction to Database System 多值依赖(续) 用下图表示这种对应 W→→S且W→→C An Introduction to Database System

An Introduction to Database System 多值依赖的性质 (1)多值依赖具有对称性 若X→→Y,则X→→Z,其中Z=U-X-Y (2)多值依赖具有传递性 若X→→Y,Y→→Z, 则X→→Z –Y (3)函数依赖是多值依赖的特殊情况。 若X→Y,则X→→Y。 (4)若X→→Y,X→→Z,则X→→Y Z。 (5)若X→→Y,X→→Z,则X→→Y∩Z。 (6)若X→→Y,X→→Z,则X→→Y-Z,X→→Z -Y。 An Introduction to Database System

An Introduction to Database System 多值依赖与函数依赖的区别 (1) 多值依赖的有效性与属性集的范围有关 (2) 若函数依赖X→Y在R(U)上成立,则对于任何Y'  Y均有X→Y' 成立 多值依赖X→→Y若在R(U)上成立,不能断言对于任何Y'  Y有X→→Y' 成立 An Introduction to Database System

An Introduction to Database System 6.2 规范化 6.2.1 函数依赖 6.2.2 码 6.2.3 范式 6.2.4 2NF 6.2.5 3NF 6.2.6 BCNF 6.2.7 多值依赖 6.2.8 4NF 6.2.9 规范化小结 An Introduction to Database System

An Introduction to Database System 6.2.8 4NF 定义6.10 关系模式R<U,F>∈1NF,如果对于R的每个非平凡多值依赖X→→Y(Y  X),X都含有码,则R∈4NF。 如果R ∈ 4NF, 则R ∈ BCNF 不允许有非平凡且非函数依赖的多值依赖 允许的非平凡多值依赖是函数依赖 An Introduction to Database System

An Introduction to Database System 4NF(续) 例: Teaching(C,T,B) ∈ 4NF 存在非平凡的多值依赖C→→T,且C不是码 用投影分解法把Teaching分解为如下两个关系模式: CT(C, T) ∈ 4NF CB(C, B) ∈ 4NF C→→T, C→→B是平凡多值依赖 An Introduction to Database System

An Introduction to Database System 6.2 规范化 6.2.1 函数依赖 6.2.2 码 6.2.3 范式 6.2.4 2NF 6.2.5 3NF 6.2.6 BCNF 6.2.7 多值依赖 6.2.8 4NF 6.2.9 规范化小结 An Introduction to Database System

An Introduction to Database System 6.2.9 规范化小结 关系数据库的规范化理论是数据库逻辑设计的工具 目的:尽量消除插入、删除一场,修改复杂,数据冗余 基本思想:逐步消除数据依赖中不合适的部分 实质:概念的单一化 An Introduction to Database System

An Introduction to Database System 规范化小结(续) 关系模式规范化的基本步骤 1NF ↓ 消除非主属性对码的部分函数依赖 消除决定属性 2NF 集非码的非平 ↓ 消除非主属性对码的传递函数依赖 凡函数依赖 3NF ↓ 消除主属性对码的部分和传递函数依赖 BCNF ↓ 消除非平凡且非函数依赖的多值依赖 4NF An Introduction to Database System

An Introduction to Database System 规范化小结(续) 不能说规范化程度越高的关系模式就越好 在设计数据库模式结构时,必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适的、能够反映现实世界的模式 上面的规范化步骤可以在其中任何一步终止 An Introduction to Database System

An Introduction to Database System 第六章 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解 6.5 小结 An Introduction to Database System

An Introduction to Database System 6.3 数据依赖的公理系统 逻辑蕴含 定义6.11 对于满足一组函数依赖 F 的关系模式R <U,F>,其任何一个关系r,若函数依赖X→Y都成立, (即r中任意两元组t,s,若tX]=sX],则tY]=sY]),则称F逻辑蕴含X →Y An Introduction to Database System

An Introduction to Database System 1. Armstrong公理系统 关系模式R <U,F >来说有以下的推理规则: A1.自反律(Reflexivity):若Y  X  U,则X →Y为F所蕴含。 A2.增广律(Augmentation):若X→Y为F所蕴含,且Z  U,则XZ→YZ为F所蕴含。 A3.传递律(Transitivity):若X→Y及Y→Z为F所蕴含,则X→Z为F所蕴含。 An Introduction to Database System

An Introduction to Database System 定理 6.1 Armstrong推理规则是正确的 (l)自反律: 若Y  X  U,则X →Y为F所蕴含 证: 设Y  X  U 对R <U,F> 的任一关系r中的任意两个元组t,s: 若t[X]=s[X],由于Y  X,有t[y]=s[y], 所以X→Y成立,自反律得证 An Introduction to Database System

定理 6.l Armstrong推理规则是正确的(续) (2)增广律: 若X→Y为F所蕴含,且Z  U,则XZ→YZ 为F所蕴含。 证:设X→Y为F所蕴含,且Z  U。 设R<U,F> 的任一关系r中任意的两个元组t,s: 若t[XZ]=s[XZ],则有t[X]=s[X]和t[Z]=s[Z]; 由X→Y,于是有t[Y]=s[Y],所以t[YZ]=s[YZ],所以 XZ→YZ为F所蕴含,增广律得证。 An Introduction to Database System

定理 6.l Armstrong推理规则是正确的(续) (3) 传递律:若X→Y及Y→Z为F所蕴含,则 X→Z为 F所蕴含。 证:设X→Y及Y→Z为F所蕴含。 对R<U,F> 的任一关系 r中的任意两个元组 t,s: 若t[X]=s[X],由于X→Y,有 t[Y]=s[Y]; 再由Y→Z,有t[Z]=s[Z],所以X→Z为F所蕴含,传递 律得证。 An Introduction to Database System

An Introduction to Database System 2. 导出规则 1.根据A1,A2,A3这三条推理规则可以得到下面三条推理规则: 合并规则:由X→Y,X→Z,有X→YZ。 (A2, A3) 伪传递规则:由X→Y,WY→Z,有XW→Z。 分解规则:由X→Y及 ZY,有X→Z。 (A1, A3) An Introduction to Database System

An Introduction to Database System 导出规则 2.根据合并规则和分解规则,可得引理6.1 引理6.l X→A1 A2…Ak成立的充分必要条件是 X→Ai成立(i=l,2,…,k) An Introduction to Database System

An Introduction to Database System Armstrong公理系统 Armstrong公理系统是有效的、完备的 有效性:由F出发根据Armstrong公理推导出来的每一个函数依赖一定在F+中; 完备性:F+中的每一个函数依赖,必定可以由F出发根据Armstrong公理推导出来 An Introduction to Database System

An Introduction to Database System 3. 函数依赖闭包 定义6.l2 在关系模式R<U,F>中为F所逻辑蕴含的函数依赖的全体叫作 F的闭包,记为F+。 定义6.13 设F为属性集U上的一组函数依赖,X U, XF+ ={ A|X→A能由F 根据Armstrong公理导出},XF+称为属性集X关于函数依赖集F 的闭包 An Introduction to Database System

An Introduction to Database System F的闭包 F={XY, YZ} F+={ Xφ, Yφ, Zφ, XYφ, XZφ, YZφ, XYZφ, XX, YY, ZZ, XYX, XZX, YZY, XYZX, XY, Y Z, XYY, XZY, YZZ, XYZY, XZ, YYZ, XYZ, XZZ, YZYZ,XYZZ, XXY, XYXY,XZXY, XYZXY, XXZ, XYYZ,XZXZ, XYZYZ, XYZ, XYXZ,XZXY, XYZXZ, XZYZ, XYXYZ,XZXYZ, XYZXYZ } F={XA1, …… , XAn}的闭包F+计算是一个NP完全问题 An Introduction to Database System

An Introduction to Database System 关于闭包的引理 引理6.2 设F为属性集U上的一组函数依赖,X,Y  U,X→Y能 由F 根据Armstrong公理导出的充分必要条件是Y XF+ 用途 将判定X→Y是否能由F根据Armstrong公理导出的问题,转化为求出XF+ 、判定Y是否为XF+的子集的问题 An Introduction to Database System

An Introduction to Database System 求闭包的算法 算法6.1 求属性集X(X  U)关于U上的函数依赖集F 的闭包XF+ 输入:X,F 输出:XF+ 步骤: (1)令X(0)=X,i=0 (2)求B,这里B = { A |( V)(  W)(V→WF∧V  X(i)∧A W)}; (3)X(i+1)=B∪X(i) (4)判断X(i+1)= X (i)吗? (5)若相等或X(i)=U , 则X(i)就是XF+ , 算法终止。 (6)若否,则 i=i+l,返回第(2)步。 An Introduction to Database System

An Introduction to Database System 算法6.1 对于算法6.1, 令ai =|X(i)|,{ai }形成一个步长大于1的严格递增的序列,序列的上界是 | U |,因此该算法最多 |U| - |X| 次循环就 会终止。 An Introduction to Database System

An Introduction to Database System 函数依赖闭包 [例1] 已知关系模式R<U,F>,其中 U={A,B,C,D,E}; F={AB→C,B→D,C→E,EC→B,AC→B}。 求(AB)F+ 。 解 设X(0)=AB; (1) X(1)=AB∪CD=ABCD。 (2) X(0)≠ X(1) X(2)=X(1)∪BE=ABCDE。 (3) X(2)=U,算法终止 (AB)F+ =ABCDE。 An Introduction to Database System

4. Armstrong公理系统的有效性与完备性 证明: 1. 有效性 可由定理6.1得证 2. 完备性 只需证明逆否命题: 若函数依赖X→Y不能由F从Armstrong公理导出,那么它必然不为F所蕴含 An Introduction to Database System

An Introduction to Database System Armstrong公理系统完备性证明 (1) 引理: 若V→W成立,且V  XF+,则W  XF+ (2) 构造一张二维表r,它由下列两个元组构成,可以证明r必是R(U,F)的一个关系,即F+中的全部函数依赖在 r上成立。 XF+ U-XF+ 11......1 00......0   11......1 11......1   (3) 若X→Y 不能由F从Armstrong公理导出,则Y 不是XF+ 的子集。 An Introduction to Database System

An Introduction to Database System 5. 函数依赖集等价 定义6.14 如果G+=F+,就说函数依赖集F覆盖G(F是G的覆 盖,或G是F的覆盖),或F与G等价。 引理6.3 F+ = G+ 的充分必要条件是F  G+ ,和G  F+ 证: 必要性显然,只证充分性。 (1)若FG+ ,则XF+  XG++ 。 (2)任取X→YF+ 则有 Y  XF+  XG++ 。 所以X→Y  (G+)+= G+。即F+  G+。 (3)同理可证G+  F+ ,所以F+ = G+。 An Introduction to Database System

An Introduction to Database System 6. 最小依赖集 定义6.15 如果函数依赖集F满足下列条件,则称F为一个极小函数依赖集。亦称为最小依赖集或最小覆盖。 (1) F中任一函数依赖的右部仅含有一个属性。 (2) F中不存在这样的函数依赖X→A,使得F与F-{X→A}等价。 (3) F中不存在这样的函数依赖X→A, X有真子集Z使得F-{X→A}∪{Z→A}与F等价。 An Introduction to Database System

An Introduction to Database System 最小依赖集 [例2] 关系模式S<U,F>,其中: U={ Sno,Sdept,Mname,Cno,Grade }, F={ Sno→Sdept,Sdept→Mname,(Sno,Cno)→Grade } 设F’={Sno→Sdept,Sno→Mname,Sdept→Mname, (Sno,Cno)→Grade,(Sno,Sdept)→Sdept} F是最小覆盖,而F’不是。 因为:F ’ - {Sno→Mname}与F ’等价 F ’ - {(Sno,Sdept)→Sdept}也与F ’等价 An Introduction to Database System

An Introduction to Database System 7. 极小化过程 定理6.3 每一个函数依赖集F均等价于一个极小函数依赖 集Fm。此Fm称为F的最小依赖集。 证明: 构造性证明,找出F的一个最小依赖集。 An Introduction to Database System

An Introduction to Database System 极小化过程(续) (1)逐一检查F中各函数依赖FDi:X→Y,若Y=A1A2 …Ak,k > 2, 则用 { X→Aj |j=1,2,…, k} 来取代X→Y。 (2)逐一检查F中各函数依赖FDi:X→A,令G=F-{X→A}, 若AXG+, 则从F中去掉此函数依赖。 (3)逐一取出F中各函数依赖FDi:X→A,设X=B1B2…Bm, 逐一考查Bi (i=l,2,…,m),若A (X-Bi )F+ , 则以X-Bi 取代X。 An Introduction to Database System

An Introduction to Database System 极小化过程(续) [例3] F = {A→B,B→A,B→C,A→C,C→A} Fm1、Fm2都是F的最小依赖集: Fm1= {A→B,B→C,C→A}   Fm2= {A→B,B→A,A→C,C→A} F的最小依赖集Fm不唯一 极小化过程( 定理6.3的证明 )也是检验F是否为极小依赖集的一个算法 An Introduction to Database System

An Introduction to Database System 第六章 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解 6.5 小结 An Introduction to Database System

An Introduction to Database System 6.4 模式的分解 把低一级的关系模式分解为若干个高一级的关系模式的方法不是唯一的 只有能够保证分解后的关系模式与原关系模式等价,分解方法才有意义 An Introduction to Database System

An Introduction to Database System 关系模式分解的标准 三种模式分解等价的定义: ⒈ 分解具有无损连接性 ⒉ 分解要保持函数依赖 ⒊ 分解既要保持函数依赖,又要具有无损连接性 An Introduction to Database System

An Introduction to Database System 模式的分解(续) 定义6.16 关系模式R<U,F>的一个分解: ρ={ R1<U1,F1>,R2<U2,F2>,…,Rn<Un,Fn>} U= ∪Ui,且不存在 Ui  Uj,Fi 为 F在 Ui 上的投影 定义6.17 函数依赖集合{X→Y | X→Y  F+∧XY Ui} 的一个覆盖 Fi 叫作 F 在属性 Ui 上的投影 n i=1 An Introduction to Database System

An Introduction to Database System 模式的分解(续) 例:S-L(Sno, Sdept, Sloc) F={ Sno→Sdept,Sdept→Sloc,Sno→Sloc} S-L∈2NF 分解方法可以有多种: 1. S-L分解为三个关系模式:SN(Sno) SD(Sdept) SO(Sloc) 2. SL分解为下面二个关系模式: NL(Sno, Sloc) DL(Sdept, Sloc) 3. 将SL分解为下面二个关系模式: ND(Sno, Sdept) NL(Sno, Sloc) An Introduction to Database System

An Introduction to Database System 具有无损连接性的模式分解 关系模式R<U,F>的一个分解 ρ={ R1<U1,F1>,R2<U2,F2>, …,Rn<Un,Fn>} 若R与R1、R2、…、Rn自然连接的结果相等,则称关系模式R的这个分解ρ具有无损连接性(Lossless join) 具有无损连接性的分解保证不丢失信息 无损连接性不一定能解决插入异常、删除异常、修改复杂、数据冗余等问题 An Introduction to Database System

An Introduction to Database System 模式的分解(续) 第3种分解方法具有无损连接性 问题:这种分解方法没有保持原关系中的函数依赖 SL中的函数依赖Sdept→Sloc没有投影到关系模式ND、NL上 An Introduction to Database System

An Introduction to Database System 保持函数依赖的模式分解 设关系模式R<U,F>被分解为若干个关系模式 R1<U1,F1>,R2<U2,F2>,…,Rn<Un,Fn> (其中U=U1∪U2∪…∪Un,且不存在Ui  Uj,Fi为F在Ui上的投影),若F所逻辑蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖Fi所逻辑蕴含,则称关系模式R的这个分解是保持函数依赖的(Preserve dependency) An Introduction to Database System

An Introduction to Database System 模式的分解(续) 4. 将SL分解为下面二个关系模式: ND(Sno, Sdept) DL(Sdept, Sloc) 这种分解方法就保持了函数依赖 An Introduction to Database System

An Introduction to Database System 模式的分解(续) 如果一个分解具有无损连接性,则它能够保证不丢失信息 如果一个分解保持了函数依赖,则它可以减轻或解决各种异常情况 分解具有无损连接性和分解保持函数依赖是两个互相独立的标准。具有无损连接性的分解不一定能够保持函数依赖;同样,保持函数依赖的分解也不一定具有无损连接性。 An Introduction to Database System

An Introduction to Database System 模式的分解(续) 第1种分解方法既不具有无损连接性,也未保持函数依赖, 它不是原关系模式的一个等价分解 第2种分解方法保持了函数依赖,但不具有无损连接性 第3种分解方法具有无损连接性,但未持函数依赖 第4种分解方法既具有无损连接性,又保持了函数依赖 An Introduction to Database System

An Introduction to Database System 分解算法 算法6.2 判别一个分解的无损连接性 算法6.3(合成法)转换为3NF的保持函数依赖的分解。 算法6.4 转换为3NF既有无损连接性又保持函数依赖的分解 算法6.5 (分解法)转换为BCNF的无损连接分解 算法6.6 达到4NF的具有无损连接性的分解 An Introduction to Database System

An Introduction to Database System 第六章 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解 6.5 小结 An Introduction to Database System

An Introduction to Database System 6.5 小结 关系模式的规范化,其基本思想: An Introduction to Database System

An Introduction to Database System 小结(续) 若要求分解具有无损连接性,那么模式分解一定能够达到4NF 若要求分解保持函数依赖,那么模式分解一定能够达到3NF,但不一定能够达到BCNF 若要求分解既具有无损连接性,又保持函数依赖,则模式分解一定能够达到3NF,但不一定能够达到BCNF An Introduction to Database System

An Introduction to Database System 小结(续) 规范化理论为数据库设计提供了理论的指南和工具 也仅仅是指南和工具 并不是规范化程度越高,模式就越好 必须结合应用环境和现实世界的具体情况合理地选择数据库模式 An Introduction to Database System

An Introduction to Database System 下课了。。。 研 究 休息一会儿。。。 An Introduction to Database System