An Introduction to Database System

Slides:



Advertisements
Similar presentations
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
Advertisements

第六章 数据库技术基础 本章要点  数据库系统概述 数据库系统概述  关系数据库 关系数据库  数据库设计 数据库设计.
复习: :对任意的x∈A,都有x∈B。 集合A与集合B间的关系 A(B) A B :存在x0∈A,但x0∈B。 A B A B.
An Introduction to Database System
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第6章 关系数据理论 6.1关系模式的设计的问题 6.2 数据依赖的推理规则 6.3规范化 6.4模式分解.
高等院校计算机教材系列 数据库原理与应用(第2版) 任课教师:刘雅莉
第六章 关系数据理论 内容出处: 1.Abraham Silberschatz《数据库系统概念》第七章.
河北化工医药职业技术学院 数据库原理及应用教案.
《高等数学》(理学) 常数项级数的概念 袁安锋
§1 线性空间的定义与性质 ★线性空间的定义 ★线性空间的性质 ★线性空间的子空间 线性空间是线性代数的高等部分,是代数学
软件设计师培训.
常用逻辑用语复习课 李娟.
第六章 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解.
An Introduction to Database System
Database Principles & Applications
数据库原理 Database Principles 第五章 数据库完整性 Database Principles.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
2-7、函数的微分 教学要求 教学要点.
第2章 关系数据库系统.
第7章 关系数据库规范化理论 7.1 函数依赖 7.2 关系规范化 7.3 关系模式的分解准则.
An Introduction to Database System An Introduction To Database System
An Introduction to Database System An Introduction to Database System
課程名稱:資料庫系統 授課老師:李春雄 博士
課程名稱:資料庫系統 授課老師:李春雄 博士
第5章 关系模式的规范化设计 冯万利.
第4章 SQL语言基础及数据库定义 4.1 基本概念 4.2 SQL Server 提供的主要数据类型 4.3 数据定义.
第7章 關聯式資料庫的正規化 7-1 正規化的基礎 7-2 功能相依 7-3 第一階到第三階正規化型式 7-4 多重值相依與第四階正規化型式
教 师:曾晓东 电 话: 数据库技术 教 师:曾晓东 电 话:
胡鹏 王慧锋 TEL: 数据库系统原理课程设计 实验环节1 胡鹏 王慧锋 TEL:
第四章关系数据库设计理论 4.1 数据依赖 4.2 范式 4.3 关系模式的规范化.
正規化 Normalization.
表格正規化簡介 講授大綱: 第一正規化 資料表的切割 第二正規化 第三正規化 Boyce/Codd正規化 第四正規化 第五正規化
第六章 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解 6.5 小结 管理科学与工程学院.
Thanks for the Slides from Renmin U
第五章 关系数据理论 关系模型有严格的数学理论基础,也是目前应用最广泛的数据模型,关系规范化是指导数据库设计的重要理论。一个好的关系数据库是应该既可以供人们方便地获取信息,而又不产生过多的不必要的重复存储问题。可以说,规范化理论是数据模型优化的理论基础,对其他数据库的逻辑设计同样具有理论上的意义。 2018年12月6日7时18分.
国家“十一五”规划教材 数据库原理与应用教程(第3版).
SQL SERVER 一些经典语句 1.
An Introduction to Database System An Introduction to Database System
An Introduction to Database System
Principle and Application of Database
数据库设计是信息系统的核心组成部分 从现实世界到数据世界的转换的过程
数据库应用技术 SQL Server 2005.
28.1 锐角三角函数(2) ——余弦、正切.
第一章 函数与极限.
An Introduction to Database System An Introduction to Database System
数列.
第6章 关系数据库规范化理论 教学目标:通过本章学习,了解不规范的关系模式存在的问题;理解函数依赖及关系规范化的相关概念,熟悉关系模式的形式化定义;掌握第一范式(1NF)、第二范式(2NF)、第三范式(3NF)及BCNF的定义及相关术语的含义;了解多值依赖及第四范式(4NF)的定义;理解函数依赖公理的内容,掌握属性闭包的定义及求解算法,能够正确判断关系模式的候选码及规范化程度;了解最小函数依赖集的定义及算法,了解对模式分解后无损连接性和函数依赖保持性的判断。
6.4不等式的解法举例(1) 2019年4月17日星期三.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
复习.
实体描述呈现方法的研究 实验评估 2019/5/1.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.把下面的关系模式转化为E-R图 1)系(系号,系名,电话) 2)教师(工号,姓名,性别,年龄,系号)
1.2 子集、补集、全集习题课.
上杭二中 曾庆华 上杭二中 曾庆华 上杭二中 曾庆华.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
第五章关系数据库设计理论 5.1 数据依赖 5.2 范式 5.3 关系模式的规范化.
第3章 关系数据库的规范化理论 本章导读: 关系规范化理论研究的是关系模式中各属性之间的依赖关系及其对关系模式性能的影响,探讨“好”的关系模式应该具备的性质,以及达到“好”的关系模式提供的方法。关系规范化理论提供了判断关系逻辑模式优劣的理论标准,是数据库设计的理论基础和关系模式算法工具,用于帮助数据库设计工程师预测和优化模式可能出现的问题。
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
§2 方阵的特征值与特征向量.
主讲教师 欧阳丹彤 吉林大学计算机科学与技术学院
第五章关系数据库设计理论 5.1 数据依赖 5.2 范式 5.3 关系模式的规范化.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
数据库技术及应用 机械工业出版社 2019/7/24.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Presentation transcript:

An Introduction to Database System 数据库系统概论 An Introduction to Database System 第六讲 关系数据理论

第六讲 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解 6.5 小结

6.1 问题的提出 关系模式存在的问题

关系模式存在的问题 例1(P170):描述学校的数据库: 学生的学号(Sno)、所在系(Sdept) 问题:如何设计关系模式? 系主任姓名(Mname)、课程号(Cno) 成绩(Grade) 问题:如何设计关系模式? 提示:1.概念模型 2.逻辑模型(关系模式)

数据依赖对关系模式的影响(续) 学校数据库的语义: ⒈ 一个系有若干学生, 一个学生只属于一个系; ⒉ 一个系只有一名主任; ⒈ 一个系有若干学生, 一个学生只属于一个系; ⒉ 一个系只有一名主任; ⒊ 一个学生可以选修多门课程, 每门课程有若干学生选修; ⒋ 每个学生所学的每门课程都有一个成绩。

假设设计成单一模式 单一的关系模式 : Student <U、F> U ={ Sno, Sdept, Mname, Cno, Grade }

Student 表 Sno Sdept Mname Cno Grade S1 计算机系 张明 C1 95 S2 计算机系 张明 C1 90 … … …

关系模式Student<U, F>中存在的问题 ⒈ 数据冗余太大 浪费大量的存储空间 例:每一个系主任的姓名重复出现 ⒉ 修改复杂(Update Anomalies) 数据冗余 ,修改数据时,维护数据完整性代价大。 例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组

关系模式Student<U, F>中存在的问题 ⒊ 插入异常(Insertion Anomalies) 该插的数据插不进去 例,如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。 ⒋ 删除异常(Deletion Anomalies) 不该删除的数据不得不删 例,如果某个系的学生全部毕业了, 我们在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。

数据依赖对关系模式的影响(续) 结论: Student关系模式不是一个好的模式。 “好”的模式: 不会发生更新异常(插入异常、删除异常、修改复杂), 数据冗余应尽可能少。

第六讲 关系数据理论 6.1 问题的提出 6.2 规范化 6.3 数据依赖的公理系统 *6.4 模式的分解 6.5 小结

6.2 规范化 规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、修改复杂和数据冗余问题。

6.2 规范化 数据依赖(P170) 数据依赖是一个关系内部属性与属性之间的一种约束关系。这种约束关系是通过属性间值的相等与否体现出来的数据间的相关联系。是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。

6.2 规范化 数据依赖的类型 函数依赖(Functional Dependency,简记为FD) 6.2 规范化 数据依赖的类型 函数依赖(Functional Dependency,简记为FD) 多值依赖(Multivalued Dependency,简记为MVD)

6.2.1 函数依赖 一、函数依赖 二、平凡函数依赖与非平凡函数依赖 三、完全函数依赖与部分函数依赖 四、传递函数依赖

一、函数依赖(P172) 定义6.1 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作X→Y。

函数依赖(续) 定义: 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,对于X的每一个值, Y都有一个确定的值与之对应,则称 “X函数确定Y” 或 “Y函数依赖于X”,记作X→Y。

一、函数依赖(续) 为什么叫函数依赖? Y=f(X) X0 --- Y0 X1 --- Y1 XN --- YN

说明: 1. 函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。 2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。 例如“姓名→性别”这个函数依赖只有在不允许有同名人的条件下成立

函数依赖(续) 假设不允许重名,则有: 例: Student(Sno, Sname, Ssex, Sage, Sdept) Sno → Ssex, Sno → Sage , Sno → Sdept, Sno ←→ Sname, Sname → Ssex, Sname → Sage Sname → Sdept 但Ssex →Sage 若X→Y,并且Y→X, 则记为X←→Y。 若Y不函数依赖于X, 则记为X─→Y。

二、平凡函数依赖与非平凡函数依赖 在关系模式R(U)中,对于U的子集X和Y, 如果X→Y,但Y  X,则称X→Y是非平凡的函数依赖 例:在关系SC(Sno, Cno, Grade)中, 非平凡函数依赖: (Sno, Cno) → Grade 平凡函数依赖: (Sno, Cno) → Sno (Sno, Cno) → Cno Cno → Cno

平凡函数依赖与非平凡函数依赖(续) 对于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明, 我们总是讨论非平凡函数依赖。

三、完全函数依赖与部分函数依赖 定义6.2 在关系模式R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有X’ Y, 则称Y完全函数依赖于X,记作X f Y。 若X→Y,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作X P Y。

完全函数依赖与部分函数依赖(续) 例: 在关系SC(Sno, Cno, Grade)中, 由于:Sno →Grade,Cno → Grade, 因此:(Sno, Cno) f Grade 例: 在关系SC(Sno, Sname, Cno, Cname, Grade)中, (Sno, Cno) p Sname (Sno, Cno) p Cname

四、传递函数依赖 定义6.3 在关系模式R(U)中,如果X→Y,Y→Z, 且Y X,Z  Y,Y→X,则称Z传递函数依赖于X。 注: 如果Y→X, 即X←→Y,则Z直接依赖于X。 例: 在关系Std(Sno, Sdept, Mname)中,有: Sno → Sdept,Sdept → Mname Mname传递函数依赖于Sno

6.2.2 码(与第二章P44的定义比较) 定义6.4 设K为关系模式R<U,F>中的属性或属性组合。若K f U,则K称为R的一个侯选码(Candidate Key)。若关系模式R有多个候选码,则选定其中的一个做为主码(Primary key)。 主属性与非主属性 ALL KEY

外部码 定义6.5 关系模式 R 中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign key)也称外码 主码又和外部码一起提供了表示关系间联系的手段。

6.2.3 范式 关系数据库中的关系模式必须满足一定的要求。满足不同程度要求的为不同范式。 范式的种类: 第一范式(1NF) BC范式(BCNF) 第四范式(4NF) 第五范式(5NF)

6.2.3 范式 各种范式之间存在联系: 某一关系模式R为第n范式,可简记为R∈nNF。

6.2.4 2NF 1NF的定义 如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。 第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。 但是满足第一范式的关系模式并不一定是一个好的关系模式。

2NF 例: 关系模式 SLC(Sno, Sdept, Sloc, Cno, Grade) 函数依赖包括: (Sno, Cno) f Grade Sno → Sdept Sdept → Sloc (Sno, Cno) P Sdept (Sno, Cno) P Sloc Sno → Sloc

2NF Sno Cno Grade Sdept Sloc SLC SLC的码为(Sno, Cno) SLC满足第一范式。 非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno) Sno Cno Grade Sdept Sloc SLC

SLC不是一个好的关系模式 (1) 插入异常 (2) 删除异常 假设Sno=95102,Sdept=IS,Sloc=N的学生还未选课,因课程号是主属性,因此该学生的信息无法插入SLC。 (2) 删除异常 假定某个学生本来只选修了3号课程这一门课。现在因身体不适,他连3号课程也不选修了。因课程号是主属性,此操作将导致该学生信息的整个元组都要删除。

SLC不是一个好的关系模式 (3) 数据冗余度大 (4) 修改复杂 如果一个学生选修了10门课程,那么他的Sdept和Sloc值就要重复存储了10次。 (4) 修改复杂 例如学生转系,在修改此学生元组的Sdept值的同时,还可能需要修改住处(Sloc)。如果这个学生选修了K门课,则必须无遗漏地修改K个元组中全部Sdept、Sloc信息。

2NF 原因 Sdept、 Sloc部分函数依赖于码。 解决方法 SC(Sno, Cno, Grade) SLC分解为两个关系模式,以消除这些部分函数依赖 SC(Sno, Cno, Grade) SL(Sno, Sdept, Sloc)

2NF 函数依赖图: SL Sno Sdept Sloc Sno Cno Grade SC

2NF 2NF的定义 2NF的定义(等价定义) 定义6.6 若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。 若关系模式R∈1NF,并且消除了非主属性对码的部分函数依赖,则R∈2NF。

例:SLC(Sno, Sdept, Sloc, Cno, Grade)∈2NF SC(Sno, Cno, Grade) ∈ 2NF SL(Sno, Sdept, Sloc) ∈ 2NF

如果关系模式R的码只有一个属性,那么R一定满足二范式。

判断关系模式R(U,F)是否符合二范式 U={A,B,C,D} F={AB →C,B →D,C →D} 经计算,属性AB是唯一的码 请问是否符合二范式?

第二范式(续) 采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。

6.2.5 3NF 请分析关系模式SL(Sno, Sdept, Sloc),依然存在更新异常和数据冗余

6.2.5 3NF 函数依赖: 例:2NF关系模式SL(Sno, Sdept, Sloc)中 Sno→Sdept Sdept→Sloc Sno→Sloc Sloc传递函数依赖于Sno,即SL中存在非主属性对码的传递函数依赖。

3NF 函数依赖图: SL Sno Sdept Sloc

3NF 解决方法 采用投影分解法,把SL分解为两个关系模式,以消除非主属性的传递函数依赖: SD(Sno, Sdept) DL(Sdept, Sloc) SD的码为Sno, DL的码为Sdept。

3NF SD的码为Sno, DL的码为Sdept。 Sno Sdept SD Sloc DL

3NF 3NF的定义 定义6.7 关系模式R<U,F> 中若不存在这样的码X、属性组Y及非主属性Z(Z  Y), 使得X→Y,Y → X,Y→Z,成立,则称R<U,F> ∈ 3NF。 3NF的定义(等价定义) 若关系模式R∈2NF,并且消除了非主属性对码的传递函数依赖,则R∈3NF。

例, SL(Sno, Sdept, Sloc) ∈ 2NF SD(Sno, Sdept) ∈ 3NF DL(Sdept, Sloc)∈ 3NF

判断关系模式R(U,F)是否符合三范式 U={A,B,C,D} F={AB →C,AB →D,C →D} 经计算,属性AB是唯一的码 请问是否符合三范式?

3NF 若R∈3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。 如果R∈3NF,则R也是2NF。 采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个2NF关系分解为多个3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余。

3NF 例:在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。 (S,J)→T,(S,T)→J,T→J 每一教师只教一门课。每门课由若干教师教,某一学生选定某门课,就确定了一个固定的教师。某个学生选修某个教师的课就确定了所选课的名称 : (S,J)→T,(S,T)→J,T→J 候选码: (S,J),(S,T)

STJ(S,T,J)符合三范式 依然存在更新异常和数据冗余 原因:T→J ,T中没有码

6.2.6 BC范式(BCNF) 定义6.8 设关系模式R<U,F>∈1NF,如果对于R的每个函数依赖X→Y,若Y不属于X,则X必含有候选码,那么R∈BCNF。

BCNF(P177) [例5] C (CNO,CNAME,PCNO) [例6] S (SNO,SNAME,SDEPT,SAGE) [例7] SJP (S,J,P) 学生\课程\名次 候选码: (S,J) 和(J,P) 函数依赖: (S,J) →P ,(J,P) →S

以上三个关系模式符合三范式,同时也符合BC范式

BCNF的性质,若R∈BCNF : R∈2NF R∈3NF 消除了主属性对不包含它的码的部分函数依赖。 消除了主属性对码的传递依赖

3NF与BCNF的关系 如果关系模式R∈BCNF, 必定有R∈3NF 若R∈3NF 则 R不一定∈BCNF

如果只有一个候选码,对于主属性来说,不包含它的候选码不存在,所以,自然就不存在主属性对不包含它的候选码的部分依赖、传递依赖。

3NF和BCNF是在函数依赖的条件下对模式分解所能达到的分离程度的测试,一个模式中的关系模式如果都属于BCNF,那么在函数依赖范畴内,它实现了彻底的分离,已消除了更新异常,3NF的“不彻底”性表现在可能存在主属性对码的部分依赖和传递依赖。

6.2.6 规范化 关系数据库的规范化理论是数据库逻辑设计的工具。 一个关系只要其分量都是不可分的数据项,它就是规范化的关系,但这只是最基本的规范化。 规范化程度可以有多个不同的级别

规范化(续) 规范化程度过低的关系不一定能够很好地描述现实世界,可能会存在插入异常、删除异常、修改复杂、数据冗余等问题 一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式集合,这种过程就叫关系模式的规范化

规范化(续) 关系模式规范化的基本步骤 1NF ↓ 消除非主属性对码的部分函数依赖 消除决定属性 2NF ↓ 消除非主属性对码的部分函数依赖 消除决定属性 2NF 集非码的非平 ↓ 消除非主属性对码的传递函数依赖 凡函数依赖 3NF ↓ 消除主属性对不包含自己码的部分和传递函数依赖 BCNF ↓ 消除非平凡且非函数依赖的多值依赖 4NF

规范化的基本思想 消除不合适的数据依赖 的各关系模式达到某种程度的“分离” 采用“一事一地”的模式设计原则 让一个关系描述一个概念、一个实体或者实体间的一种联系。若多于一个概念就把它“分离”出去 所谓规范化实质上是概念的单一化

规范化(续) 不能说规范化程度越高的关系模式就越好 在设计数据库模式结构时,必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适的、能够反映现实世界的模式 上面的规范化步骤可以在其中任何一步终止