非计算机应用专业教材 数据库原理与应用 李 明 科学出版社
[学习目标] 了解数据、信息、数据处理的概念计算机数据 管理四个阶段的特点 掌握数据库系统的组成和主要特点 掌握数据库系统体系结构 掌握DBMS的主要功能 了解使用数据库系统存取数据过程
第1章 概 述 1. 1概述 1.2 数据管理技术的发展 1.3 数据库系统体系结构 退出
1.1.1数据、信息与数据处理 1.数据的概念 所谓数据,可由人工或自动化手段加以处理的那些事实、概念和指示的表示形式,包括字符、数字、图形、图象、声音等多媒体数据。 数据有两种形态。一种形态为人类可读形式的数据,简称人读数据。另一种是机器可读形式的数据,简称机读数据。
2.信息的概念(Information) 信息是关于现实世界事物的存在方式或运动形态反映的综合,是人们进行各种活动所需要的知识。 数据与信息既有联系又有区别。数据是载荷信息的物理符号或称为载体。数据能表示信息,但并非任何数据都能表示信息 信息只是人们消化理解了的数据。
3.数据处理 数据处理是指从某些已知的数据出发,推 导加工出一些新的数据,这些新的数据又表示 了新的信息。在具体操作中,涉及到数据收集、 管理、加工和输出等过程。
在数据处理中,通常数据的计算比较简单, 而数据的管理比较复杂。数据管理是指数据的 收集、整理、组织、存储和检索等操作,
我们可以用下面的式子简单地表示出信息与数据之间的关系: 信息=数据十处理
图1.1信息处理
1.1.2 信息系统 信息系统:是指为了某些明确的目的而建立的,由人员、设备、程序和数据集合构成的统一整体。信息系统的主要功能是提供信息,以支持一个组织机构的运行、管理和决策。 信息系统分类:数据处理系统EDP 管理信息系统MIS 决策支持系统DSS
数据处理系统EDP:用计算机代替繁杂的手工事务处理工作,其目的是提高数据处理的准确性、及时性,节约人力、提高工作效率 ;(会计核算软件) 管理信息系统MIS:是一个由人、计算机等组成的能进行信息的收集、传递、储存、加工、维护和使用的系统。(某企业管理信息系统由技术管理子系统、人事管理子系统 ) 决策支持系统DSS:决策支持系统的本质是将多个广义模型有机组合起来,对数据库中的数据进行处理而形成决策模型。 MIS是利用数据库技术实现各级管理者的管理业务,在计算机上进行各种事务处理工作。DSS则为各级管理者提供辅助决策的能力。
1.2 数据管理技术的发展 数据管理技术的发展经历了: 人工管理阶段 文件系统阶段 数据库技术阶段
1.2.1 人工管理阶段 (1)数据不保存 (2)由应用程序管理数据 (3)数据不共享 (4)数据不具有独立性
1.2.2 文件系统阶段 可以看到用文件系统管理数据具有如下特点: (1)数据可以长期保存 数据可以组织成文件长期保存在计算机中反复使用。 1.2.2 文件系统阶段 可以看到用文件系统管理数据具有如下特点: (1)数据可以长期保存 数据可以组织成文件长期保存在计算机中反复使用。 (2)由文件系统管理数据 在文件系统的支持下,程序只需用文件名访问数据, 不必关心数据的物理位置。
文件系统仍存在以下缺点 (1)数据共享性差,冗余度大 (2)缺乏数据独立性 (3) 数据无集中管理
1.2.3 数据库技术阶段 一.数据库系统的组成 系统由以下几部分组成:硬件系统、数据库集合、软件(操作系统、数据库管理系统及相关软件)和人员
图1.2 数据库系统层次示意图
数据库 数据库(DB)是用来存储数据的。数据库中有两大类数据,一类是用户数据。另一类是系统数据。 关于数据库的定义有很多,一般认为数据库是长期存储在计算机内、有组织的和可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
1.开发人员 系统分析员:负责应用系统的需求分析和规范说明。他们要和 用户 及DBA相结合,确定系统的硬、软件配置并 参与数据库各级模式的概要设计。 数据库管理员DBA:全面负责建立、维护和管理数据库系统。 应用程序员:负责设计应用系统的程序模块,根据外模式编写 应用程序,对数据库进行操作。 用户:通过数据库应用系统提供的界面来使用数据库。
1.2.4数据库系统的主要持点 1.实现数据共享,数据冗余度小 在文件系统中文件是面向一个特定应用的,造成了不同的应用之间不能共享数据,其后果是数据的冗余存放,即同一个数据存放在多个文件中。 在数据库系统中数据不再面向某个应用而是面向整个系统,因此数据可以被多个用户、多个应用共享使用。
2.采用特定的数据模型 数据结构化是数据库和文件系统之间的根本区别。 数据库中的数据是有结构化的,文件系统中的数据是无结构的,. 数据库的最小存取单位是数据项。在数据库中用户既可以存取数据库中的一条记录,也可以存取一个数据项或一组数据项。
3.具有较高的数据和程序独立性 包括数据的物理独立性和数据的逻辑独立性,数据独立性是数据库系统的一个重要概念。 物理独立性是指应用程序和数据库中数据的存放位置和存储格式是相互独立的。 逻辑独立性是指应用程序和数据库的逻辑结构是相互独立的。
4.有统一的数据控制功能 数据的安全性保护 数据的完整性检查 并发控制 数据库恢复
由数据库管理系统提供数据安全完整性、并发控制和恢复能力 表1.1 数据管理三个阶段的比较 比较 人工管理 文件系统 数据库系统 应用范围 科学计算 科学计算、管理 数据处理 硬件 无直接存取存储设备 磁盘、磁鼓 大容量磁盘 软件 没有操作系统 有文件系统 有数据库管理系统 处理方式 批处理 联机实时处理 批处理 联机实时处理, 分布处理批处理 数据的管理者 人 数据库管理系统 数据面向的对象 某一应用程序 整个应用系统 数据的共享程度 无共享,冗余度极大 共享性差,冗余度大 共享性高,冗余度小 数据的独立性 不独立,完全依赖于程序 独立性差 高度的物理独立性和逻辑独立性 数据的结构化 无结构 记录内有结构, 整体无结构 整体结构化,用数据模型描述 数据控制能力 应用程序自己控制 由数据库管理系统提供数据安全完整性、并发控制和恢复能力
1.2.4分布式数据库系统阶段 分布式数据库由一组数据组成,这组数据物理上分布在计算机网络的不同结点上,逻辑上是属于同一个系统。 它们都拥有各自的数据库、中央处理机、终端,以及各自的局部数据库管理系统。因此分布式数据库系统可以看作是一系列集中式数据库系统的联合。它们在逻辑上属于同一系统,但在物理结构上是分布式的。
计算机1 通信网络 计算机2 DB1 计算机3 DB3 DB2 图1.5分布式数据库系统
其主要优点有: 1.局部自主 网络上每个结点的数据库系统都具有独立处理本地事务的能力,而且各局部结点之间用通信网络连接也能够互相访问、有效地配合处理更复杂的事务。网络上的每个结点都可以支持客户的有两种应用,即局部应用和全局应用。
2.可靠性和可用性 分布式系统比集中式系统有更高的可靠性,在个别结点或个别通信链路发生故障的情况下可以继续工作。
3.效率和灵活性 分布式系统分散了工作负荷,缓解了单机容量的压力。数据可以存储在邻近的常用结点,如果本结点的数据子集包含了要查询的全部内容,显然比集中式数据库在全集上查找节省时间。同时系统易于实现扩展。
1.3 数据库系统体系结构 1.3.1数据库系统的三级结构 外模式(external schema):三级模式最上层或称为子模式、应用模式、局部模式等。它是对数据库在某个方面局部应用所涉及数据的逻辑结构和特征的描述,它是终端用户和应用程序员所见到的数据库,称为数据视图
模式 (schema) : 三级模式的中间层(或称为概念模式、逻辑模式、全局模式等)。它是整个数据库逻辑结构的特征的描述。用户以DBMS支持的逻辑数据模型为基础,以DBMS提供的模式描述(定义)语言DDL为工具,给出数据库中的所有记录(各数据项的名称、类型、取值范围等)和联系的定义,并给出对数据的安全性、有效性等要求。比如数据库的基本表。
内模式(internal schema): 最下层或称为存储模式、物理模式等。它是对整个数据库存储结构的特征的描述,用户以DBMS和操作系统支持的存储结构和特征为依托,以DBMS提供的内模式描述(定义)语言(Data Storage Description/Definition Language,DSDL)为工具,给出全局模式所对应的存储结构和特征的定义。
1.3.2 DBMS的主要功能 1.数据定义功能 2.数据操纵功能 3.数据库的运行控制功能 4.数据库的建立和维护功能
1.数据定义方面的程序模块 (1)数据库逻辑结构的定义模块,在关系数据管理系统(RDBMS)中就是创建数据库、创建表、创建视图和创建索引等定义模块。 (2)安全性定义,如授权定义及处理模块。 (3)完整性定义,如主码、外码、其他完整性约束定义及处理模块。
2.数据操纵方面的程序模块 (1) 查询(Select语句)处理程序模块。 (2) 数据更新(增加、删除、修改)程序模块。 (3) 交互式查询程序模块。 (4) 嵌入式查询程序模块。
3.数据库的运行控制功能 (1)并发控制功能 对多用户并发操作加以控制、协调。 例如,当某个用户正在修改某些数据项时,其他户同时存取,就可能导致错误结果。如果两个用户同时修改同一数据时,先存储的修改就会丢失。数据库管理系统应对要修改的记录采取一定的措施,如加锁,暂时不让其他用户访问,待完成修改存盘之后再开锁。
(2)数据的安全性控制 数据安全性控制是对数据库采用的一种保护措施,防止非授权用户存取造成数据泄密或破坏。例如,设置口令、确定用户访问等级和数据存取权限,系统审查通过后才执行允许的操作。
(3)数据的完整性控制 数据完整性是数据的准确性和一致性的测度。系统应采取一定的措施确保数据有效、与数据库的定义一致。 例如,将日期2005年2月13日:02/13/05误录成13/02/05,因没有13月份,系统不予接受,必须重新录入
1.3.3使用数据库系统存取数据过程 使用数据库系统存取数据过程大致如下:参见图1.7 1. 用户向DBMS发出读/写存取数据的要求;
5. DBMS按照内模式数据定义向操作系统发送读取数 据的命令; 6. 操作系统执行此命令从外存数据库中读出指定的数 据并送入在内存的系统缓冲区中; 7. 操作系统系统取出缓冲区数据并相继进行内模式到 模式、模式到外模式的数据转换后,把它写出入用 户缓冲区; 8. DBMS把数据从用户缓冲区取出给用户使用,至此 结束一次访问数据的读取过程。
小 结 1.数据、信息与数据处理的概念,信息=数据十处理。 2.信息系统分类:数据处理系统;管理信息系统;决策支持系统。 小 结 1.数据、信息与数据处理的概念,信息=数据十处理。 2.信息系统分类:数据处理系统;管理信息系统;决策支持系统。 3.利用计算机进行数据处理相继经历了如下四个阶段: 人工管理阶段→文件系统阶段→数据库系统阶段→分布式数据库 系统阶段。 4.在数据库管理系统支持下数据与程序数据库系统的主要持点有: 实现数据共享,减少数据冗余、采用特定的数据模型、具有较高 的数据独立性和有统一的数据控制功能。。
小 结 5.系统是指引进数据库技术后的计算机系统。数据库系统的组成: 硬件、软件、数据库管理员和人员。 小 结 5.系统是指引进数据库技术后的计算机系统。数据库系统的组成: 硬件、软件、数据库管理员和人员。 数据库系统的人员包括:数据库管理员(DBA)、系统分析员、 应用程序员和用户。不同人员的职责和作用不同。 6.数据库具有三级结构,也称为三级模式。在数据操作中,为了把 数据库从用户界面存储到外存数据库中,或把外存数据库中的数 据取出传送到用户界面,则必须经过二级数据的转换过程(映 像)。
小 结 7.DB、DBS 和DBMS之间的关系。 8.DBMS的主要功能:数据库的定义功能, 数据操纵功能和数据库运行控制功能。 小 结 7.DB、DBS 和DBMS之间的关系。 8.DBMS的主要功能:数据库的定义功能, 数据操纵功能和数据库运行控制功能。 9.使用数据库系统存取数据过程,以及数据 库系统的访问。
完