第七章 数据库管理系统
学习目标 了解并掌握: 数据库系统的基本概念 不同计算机系统数据管理方法的基本特征 数据库系统的基本组成和发展 数据模型的基本概念,包括数据描述对象、ER图、数据模型结构等 关系性数据库的基本概念 计算机数据的管理和应用中涉及的基本概念,如数据文件、批处理、实时处理、集中处理和分散处理等 计算机技术的新发展
数据库系统基础知识 数据库系统基本概念 数据 数据处理 数据库 数据库系统 数据库应用系统
数据库系统基础知识 数据库(Data Base)是指存储在计算机存储设备上的结构化的相关数据的集合。 数据库系统是指引进数据库技术后的计算机系统,是实现有组织地、动态地存储大量相关数据,提供数据处理和信息共享的一种便利手段。 数据库技术产生于20世纪60年代末70年代初,其主要目的是有效地管理和存取大量的数据资源。数据库技术主要研究如何存储、使用和管理数据,是计算机数据管理技术发展的新阶段。
数据库管理方法 数据管理方法目前共经历了人工管理阶段、文件系统阶段和数据库系统阶段 。 人工管理阶段的特点 文件系统阶段的特点 数据库系统阶段的特点 采用复杂的结构化的数据模型 较高的数据独立性 最低的冗余度 数据控制功能
数据模型 数据描述对象 人们在研究和处理数据的过程中,常把数据的转换分为三个领域——现实世界、信息世界、机器世界. 这三个世界间的转换过程就是将客观现实的信息反映到计算机数据库中的过程。
数据模型 数据描述对象 现实世界——客观存在的世界 事务、特征、唯一特征 信息世界——对客观存在世界的抽象反映 实体(集)、属性、键、联系 机器世界——对信息世界进一步的抽象反映 文件、记录、字段(数据项)、关键字
数据模型 信息模型和E-R方法 首先把现实世界抽象为信息世界,然后再将信息世界转化为机器世界 在把现实世界抽象为信息世界的过程中,实际上是抽象出现实系统中有应用价值的元素及其关联,这时所形成的信息结构是概念模型。 抽象出概念模型后,再把概念模型转换为某一DBMS支持的数据模型。 E-R方法是P.P.S.Chen1976年提出的一种能够对现实世界的信息进行描述的方法,是目前描述概念模型最常用的方法。 它使用的工具称作E-R图,它所描述的现实世界的信息结构称为企业模式,也把这种描述结果称为E-R模型。
数据模型 结构数据模型 结构数据模型是机器世界的数据模型。实际数据库系统中所支持的数据模型主要有层次模型、网状模型和关系模型。 用树形结构来表示实体之间联系的模型称为层次模型。 用网状结构来表示实体之间联系的数据模型称为网状模型。 用一个二维表格表示实体和实体间联系的模型,称为关系模型。
数据模型 数据模型的三要素 数据结构是所研究的对象类型的集合,在数据库系统中通常按照数据结构的类型来命名数据模型,如层次结构、网状结构和关系结构的模型分别命名为层次模型、网状模型和关系模型。 数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。 数据的约束条件是完整性规则的集合,完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。
关系型数据库系统 关系型数据模型 用关系(表格数据)表示实体和实体之间联系的模型称为关系模型。 关系模型中常用的关系操作包括:选择、投影、连接、除、并、交、差等查询操作和增、删、改操作两大部分。查询的表达能力是其中最重要的部分。 在关系型数据库中,完整性约束用于确保数据的准确性和一致性。 关系模型提供了丰富的完整性控制机制,允许定义三类完整性:实体完整性、参照完整性和用户定义完整性。其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,应该由关系系统自动支持。
关系型数据库系统 数据依赖与关系规范化理论 数据操作异常 数据冗余 修改异常 插入异常 删除异常 函数依赖、完全函数依赖和传递函数依赖
关系型数据库系统 数据库系统 数据库、数据库管理系统和数据库系统是三个不同的概念。数据库强调的是数据,数据库管理系统强调的是系统软件,而数据库系统强调的是数据库的整个运行系统。 数据库系统的三级模式 外模式 –N个 概念模式- 1个 内模式 数据库系统是由计算机系统、数据、数据库管理系统和有关人员组成的具有高度组织的总体。
关系型数据库系统 数据库管理系统功能 数据库管理系统(DBMS)是指帮助用户建立、使用和管理数据库的软件系统。数据库管理系统提供了用户和数据库之间的软件界面,使用户能更方便地操作数据库。一般来说,它应有如下功能: (1) 数据定义。和高级语言类似,须定义需要的数据类型。 (2) 数据处理。DBMS必须提供用户对数据库的存取能力,包括记录的增加、修改、检索和删除等。 (3) 数据安全性、完整性、并发性控制。管理和监督用户的权限,防止用户有任何破坏或者恶意的企图,保持进入数据库中的存储数据的语义正确性和有效性,防止改变数据的语义;正确处理多用户多环境下的并发操作。 (4) 效率。DBMS应保证数据库的高效率运行,以提高数据检索和修改的速度。
关系型数据库系统 数据库管理系统功能 (3) 数据查询语言(DQL):供用户对数据库进行数据的查询操作(数据的检索和统计等)。 数据库管理系统通常包括以下3个组成部分: (1) 数据描述语言(DDL):用来描述数据库的结构,供用户建立数据库。 (2) 数据操作语言(DML):供用户对数据库进行数据处理操作(数据的增加、删除和修改等)。 (3) 数据查询语言(DQL):供用户对数据库进行数据的查询操作(数据的检索和统计等)。
数据库系统的发展 1.第一代数据库系统——层次和网状数据库管理系统 2.第二代数据库系统——关系数据库管理系统(RDBMS) 3.新一代数据库技术的研究和发展 面向对象的关系型数据库管理系统 多学科技术结合应用 专门领域应用
计算机数据的管理和应用 数据文件 按记录的内容作用进行划分,可以将数据文件分为以下类型: 1. 主文件:指数据随着交易事项的发生而更新的文件。如会计信息系统中的“总账”和“辅助账”文件等。 2. 事务文件:指用于更新主文件记录的临时性文件。如会计信息系统中的“销售订单”、“存货验收单”、“现金收据”等。 3. 参照文件:存放作为处理事项标准的文件。如“价格表”、“员工花名册”“客户信贷额度表”等。 4. 存档文件:用于保存过去事务记录的文件,以备以后查阅。如“日记账”、“前期总账”等。
计算机数据的管理和应用 数据文件 按其所采用的组织结构进行划分,通常将数据文件分为以下三类: 1. 顺序文件:文件中的记录按顺序存贮,各记录必须按顺序读取和放回。 2. 索引顺序文件:文件中的记录按顺序存贮,同时利用一个索引文件存放各记录的物理地址,该类型的文件可以直接读取。 3. 直接存取文件:将数据存储于磁盘的某一特定位置(即明确地表示出保存记录的所在磁盘扇区、扇面、磁道等)。直接存取方法的关键是磁盘地址的确定,该地址以记录的关键字为基础确定。直接存取文件的存取速度快。
计算机数据的管理和应用 数据处理方法 1.使用顺序文件的批处理系统 采用该数据处理方式最初的步骤是将文件(包括事务文件和主文件)按关键值的一定规则排序,而且事务文件必须具有与主文件相同的排列顺序,需事先编写排序程序。顺序文件的一个重要特征就是在更新处理过程完成之后,自动生成一个新的主文件,与原文件同时存在。这一特点有助于在当前的主文件被破坏时利用原来的主文件及相应的事务文件重新恢复。 2.使用直接存取文件的批处理系统 将顺序文件换成直接存取文件将大大简化系统,不必专门编写排序程序,但是,由于直接存取文件没有自动备份文件的功能,因而需要特地编写备份程序。该处理方式下的更新是一种破坏式的更新(即主文件只提供更新后的数据)。
计算机数据的管理和应用 数据处理方法 3.使用实时数据收集方式的批处理系统 指在业务发生的当时收集数据,但要等数据达到一定数量时方才进行批处理。实时数据收集阶段产生的文件必须是直接存取文件。 4.实时处理系统 在事务发生的当时进行处理,只能采用直接存取文件形式,需要一定的网络、通讯技术的支持。计算机终端分布于企业内部的各个角落进行数据的收集、处理和传递工作,可以提高生产率,降低库存,加快存货周转,减少账单的传送时间,增加客户的满意程度。
计算机数据的管理和应用 计算机系统管理模式 集中式计算机系统管理采用集中的方式管理计算机系统资源,在这种系统中,由全局唯一的操作系统,以分时或批处理的方式管理系统资源,为管理者提供服务,组成统一的管理平台。 分散式计算机系统管理方式下采用分散的方式管理计算机系统资源,各不同部门或处理中心都有自己的一个完整计算机处理系统和操作系统,计算机系统的使用者集最终用户、应用开发者和系统管理者于一身,系统管理的任务落到每个使用者的身上。 分布式系统的管理方式是介于分散和集中之间,是一种有序的分散,灵活的集中。
阅读材料:IBM“毒蛇”出动 IBM新推出的数据库产品有什么新特点? 对企业管理应用有些什么好处?
Q&A