1.1 数据结构讨论的范畴 1.2 基本概念 1.3 算法和算法的量度.

Slides:



Advertisements
Similar presentations
2009 套读自考本科简介 —— 抓住机遇,用知识改变命运 目 录 二、提升学历、提升自身素质的途径选择 三、高教自考和套读自考本科介绍 四、我校自考套读本科情况介绍 一、就业状况 五、我校今年招生专业介绍.
Advertisements

组长 : 章莹莹 组员 : 陆文嫣 舒翼 钱悠舜 谢瑞 婷. 东方明珠塔位于上海蒲东, 1991 年 7 月 30 日动 工, 1994 年 10 月 1 日建成。塔高 468 米,与外滩 的 “ 万国建筑博览群 ” 隔江相望,建设完成时, 列亚洲第一,世界第三高塔。 东方明珠塔由三根直径为 9 米的立柱、塔座、下.
我的家乡我的家乡 河北迁安河北迁安. 迁安市隶属于河北省, 位于河北省东北部,燕 山南麓,滦河岸边,地 理坐标为:东经 118°37′ ~ 118°55′ ,北 纬 39°51′ ~ 40°15′ 之间, 辖 12 个镇、 7 个乡、 1 个 街道,总面积 1208 平方 公里,截至 2011 年,总.
旅游景点分布介绍.  1 、自然景观  2 、人文景观  3 、展馆  4 、休闲度假.
小组成员 : 陈佳 张美蓉 边疆 吴程 阮宇博 郭聪. 仙都 ,位于缙云县境内,是一 处以峰岩奇绝、山水神秀为特色、 融田园风光与人文史迹为一体, 以观光、休闲、度假和科普为主 的国家级重点风景名胜区、国家 首批 AAAA 级旅游区。境内九 曲练溪、十里画廊;山水飘逸、 云雾缭绕。有奇峰一百六、异洞.
邵阳. 史称 “ 宝庆 ” 。位于湖南省 西南部,南接广西壮族自治 区桂林市。总面积 平 方公里,全市辖 3 个市辖区、 7 个县、 1 个自治县,代管 1 个 县级市。市人民政府驻大祥 区。是一座拥有 2500 多年历 史的古城 。 宝庆湖南桂林 有娄邵铁路与湘黔、京广 线相接,沪昆高速、
我的家乡我塑造 制作者:韩树涛.
基本概論 Basic concepts.
恩平市地方税务局 企业所得税年度纳税申报表 (A类、2014年版) 培训 税政股 李幸乔
練習 5月31日.
数据结构 杨鹏宇 QQ: 版权所有,转载或翻印必究
Introduction 基本概念 授課老師:蕭志明
结合崇明建设生态岛和开发旅游景点开发的现状与问题
教 师:曾晓东 电 话: E_mail: 计算机软件技术基础 教 师:曾晓东 电 话: E_mail:
不会宽容人的人, 是不配受到别人的宽容的。 贝尔奈.
复习回顾 a a×a a×a×a a a×a×a= a×a= 1.如图,边长为a厘米的正方形的面积 为 平方厘米。
第六课 遗传与变异 第四课时 基因的分离定律.
数据结构 张秀虹
美丽麻城.
我的家乡 潍坊.
本英语136 陈锷.
数据结构(C语言版) Data Structure
中国建筑钢结构施工企业诚信评价建设管理办法
肇庆七星岩.
美丽青浦,古韵水乡 青浦一中 六(4)班 庄歆怡.
第十章 内部排序 知识点3:快速排序.
第6章 程序设计与算法 计算机应用基础 数学与计算机工程学院.
第二章 线性表 1 线性表的逻辑结构及其基本操作 2 线性表的顺序存储结构 3 线性表的链式存储结构 4 静态链表 5 应用实例.
基因分离规律习题课.
对程序进行推理的逻辑 计算机科学导论第二讲
邵阳文化.
凤凰古城 公共管理学院李靖涛 学号
企业所得税年度申报表讲解 —— 特别行业.
第一节 孟德尔的豌豆杂交实验.
中国古代史中考复习方略 石城二中 黄北京.
数据结构与算法 数据结构与算法实验
C++程序设计 王希 图书馆三楼办公室.
专题研讨课二: 数组在解决复杂问题中的作用
C语言程序设计 第十二章 位运算.
编译原理与技术 类型检查 2018/11/21 《编译原理与技术》-类型检查.
cn/~dongeliu/dsa.html 刘 东 信息学院6系 中国科学技术大学
计算机网络讲义 第5章 批量数据处理—数组 一维数组 排序和查找 二维数组 字符串.
算法的基本概念.
第 3 讲 线性表(一).
第一章 绪论.
明解C++教學手冊 柴田望洋 博士 著 書號:PG20269
第三章 栈和队列.
第四章 串.
计算机算法设计与分析(第3版) 王晓东 编著 电子工业出版社.
作业 考核方式 书面作业:每个单元3-5个题,树、图和查找单元5-10个题。 上机作业:从第三周起每周一次 , 大约14次
Chapter 01 Introduction 第一章 绪论
Week 2: 程式設計概念與 演算法的效能評估
C语言版 软件与理论教研室 张泽宝 哈尔滨工程大学计算机科学与技术学院.
OOP6 結構Struct 黃兆武.
经典算法之 冒 泡 排 序.
第1章 绪论 2019/4/16.
Java變數 2014/6/24.
保留字與識別字.
第1章 绪论(二) 教学目标 理解算法的特性及评价标准 掌握算法时间复杂度和空间复杂度的分析方法 1/
<编程达人入门课程> 本节内容 为什么要使用变量? 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ:
資料結構簡介 綠園.
第二章 类型、对象、运算符和表达式.
第二章 基本数据类型 ——数据的表示.
#include <iostream.h>
本节内容 指针类型.
本章主題 C++的程式結構 資料型態與宣告 算術運算 簡易的輸入輸出指令 程式編譯(Compile)的過程與原理.
§12-5 同方向同频率两个简谐振动的合成 一. 同方向同频率的简谐振动的合成 1. 分振动 : 2. 合振动 : 解析法
變數、資料型態、運算子.
基本資料型態 變數與常數 運算子 基本的資料處理 授課:ANT 日期:2014/03/03.
安排座位.
Presentation transcript:

1.1 数据结构讨论的范畴 1.2 基本概念 1.3 算法和算法的量度

1.1 数据结构讨论的范畴 Niklaus Wirth: Algorithm + Data Structures = Programs 程序设计: 算法: 数据结构: 为计算机处理问题编制 一组指令集 处理问题的策略 问题的数学模型

例如: 数值计算的程序设计问题 结构静力分析计算 ─━ 线性代数方程组 全球天气预报 ─━ 环流模式方程 (球面坐标系)

非数值计算的程序设计问题 例一: 求一组(n个)整数中的最大值 算法: ? 模型:? 基本操作是“比较两个数的大小” 取决于整数值的范围

例二:计算机对弈 算法:? 模型:? 对弈的规则和策略 棋盘及棋盘的格局

例三:足协的数据库管理 需要管理的项目? 如何管理? 用户界面? 算法:? 模型:? 各种表格

概括地说: 数据结构是一门讨论“描述现实世界实体的数学模型(非数值计算)及其上的操作在计算机中如何表示和实现”的学科。

1.2 基本概念 一、数据与数据结构 二、数据类型 三、抽象数据类型

一、数据与数据结构 数据: 所有能被输入到计算机中,且能被计算机处理的符号的集合。 是计算机操作的对象的总称。 是计算机处理的信息的某种特定的符号表示形式。

数据元素: 是数据(集合)中的一个“个体” 是数据结构中讨论的基本单位

数据项: 是数据结构中讨论的最小单位 数据元素可以是数据项的集合 例如: 描述一个运动员的数据元素可以是 称之为组合项

数据结构: 带结构的数据元素的集合 ≠ 则在数据元素 a1、a2 和 a3 之间存在着“次序”关系 a1,a2、a2,a3 假设用三个 4 位的十进制数表示一个含 12 位数的十进制数。 例如: 3214,6587,9345 ─ a1(3214),a2(6587),a3(9345) 则在数据元素 a1、a2 和 a3 之间存在着“次序”关系 a1,a2、a2,a3 ≠ 3214,6587,9345 a1 a2 a3 6587,3214,9345 a2 a1 a3

数据结构: 带结构的数据元素的集合 行的次序关系: 列的次序关系: a1 a3 a5 a2 a4 a6 a1 a2 a3 a4 a5 a6 中六个元素之间 存在两个关系: 行的次序关系: 列的次序关系: row = {<a1,a2>,<a2,a3>,<a4,a5>,<a5,a6>} col = {<a1,a4>,<a2,a5>,<a3,a6>} a1 a3 a5 a2 a4 a6 a1 a2 a3 a4 a5 a6

{<ai, ai+1>| i=1, 2, 3, 4, 5} 数据结构: 带结构的数据元素的集合 再例,在一维数组 {a1, a2, a3, a4, a5, a6} 的数据元素之间存在如下的次序关系: {<ai, ai+1>| i=1, 2, 3, 4, 5} 可见,不同的“关系”构成不同的“结构” 或者说,数据结构是相互之间存在着某种逻辑关系的数据元素的集合。

数据的逻辑结构可归结为以下四类: 线性结构 树形结构 图状结构 集合结构

Data_Structures = (D, S) 数据结构的形式定义为: 数据结构是一个二元组 Data_Structures = (D, S) 其中:D 是数据元素的有限集, S 是 D上关系的有限集。

数据的存储结构 —— 逻辑结构在存储器中的映象 “数据元素”的映象 ? “关系”的映象 ?

数据元素的映象方法: 用二进制位(bit)的位串表示数据元素 (321)10 = (501)8 = (101000001)2 (321)10 = (501)8 = (101000001)2 A = (101)8 = (001000001)2

x y 关系的映象方法: (表示x, y的方法) 顺序映象 以相对的存储位置表示后继关系 例如:令 y 的存储位置和 x 的存储位置之间差一个常量 C 而 C 是一个隐含值,整个存储结构中只含数据元素本身的信息 x y

链式映象 以附加信息(指针)表示后继关系 需要用一个和 x 在一起的附加信息指示 y 的存储位置 y x

在不同的编程环境中, 存储结构可有不同的描述方法。 当用高级程序设计语言进行编程时,通常可用高级编程语言中提供的数据类型描述之。

typedef int Long_int [3] 例如: 以三个带有次序关系的整数表示一个长整数时,可利用 C 语言中提供的整数数组类型。 定义长整数为: typedef int Long_int [3]

二、数据类型 在用高级程序语言编写的程序中, 必须对程序中出现的每个变量、 常量或表达式,明确说明它们所 属的数据类型。

例如,C 语言中提供的基本数据类型有: 整型 int 浮点型 float 实型( C++语言) 双精度型 double 字符型 char 逻辑型 bool ( C++语言)

不同类型的变量,其所能取的值的范围不同,所能进行的操作不同。 数据类型 是一个 值的集合 和定义在此集合上的 一组操作 的总称。

是指一个数学模型以及定义在此数学模型上的一组操作。 三、抽象数据类型 (Abstract Data Type 简称ADT) 是指一个数学模型以及定义在此数学模型上的一组操作。

例如,抽象数据类型复数的定义: ADT Complex { 数据对象: D={e1,e2|e1,e2∈RealSet } 数据关系: R1={<e1,e2> | e1是复数的实数部分 | e2 是复数的虚数部分 }

AssignComplex( &Z, v1, v2 ) 基本操作: 操作结果:构造复数 Z,其实部和虚部 DestroyComplex( &Z) 操作结果:复数Z被销毁。 GetReal( Z, &realPart ) 初始条件:复数已存在。 操作结果:用realPart返回复数Z的实部值。

GetImag( Z, &ImagPart ) } ADT Complex 初始条件:复数已存在。 操作结果:用ImagPart返回复数Z的虚部值。 Add( z1,z2, &sum ) 初始条件:z1, z2是复数。 操作结果:用sum返回两个复数z1, z2 的 和值。 } ADT Complex

假设:z1和z2是上述定义的复数 则 Add(z1, z2, z3) 操作的结果 即为用户企求的结果 z3 = z1 + z2

ADT 有两个重要特征: 数据抽象 用ADT描述程序处理的实体时,强调的是其本质的特征、其所能完成的功能以及它和外部用户的接口(即外界使用它的方法)。 将实体的外部特性和其内部实现细节分离,并且对外部用户隐藏其内部实现细节。 数据封装

抽象数据类型的描述方法 其中:D 是数据对象; S 是 D 上的关系集; P 是对 D 的基本操作集。 抽象数据类型可用(D,S,P)三元组表示。 其中:D 是数据对象; S 是 D 上的关系集; P 是对 D 的基本操作集。

ADT 抽象数据类型名 { 数据对象:〈数据对象的定义〉 数据关系:〈数据关系的定义〉 基本操作:〈基本操作的定义〉 } ADT 抽象数据类型名 其中基本操作的定义格式为: 基本操作名(参数表) 初始条件:〈初始条件描述〉 操作结果:〈操作结果描述〉

赋值参数 只为操作提供输入值。 引用参数 以&打头,除可提供输入值外, 还将返回操作结果。 初始条件 描述了操作执行之前数据结构和参数应满足的条件,若不满足,则操作失败,并返回相应出错信息。 操作结果 说明了操作正常完成之后,数据结构的变化状况和应返回的结果。若初始条件为空,则省略之。

抽象数据类型的表示和实现 抽象数据类型需要通过固有数据类型(高级编程语言中已实现的数据类型)来实现。 例如,对以上定义的复数。

typedef struct { float realpart; float imagpart; }complex; // -----存储结构的定义 typedef struct { float realpart; float imagpart; }complex; // -----基本操作的函数原型说明 void Assign( complex &Z, float realval, float imagval ); // 构造复数 Z,其实部和虚部分别被赋以参数 // realval 和 imagval 的值

float GetReal( cpmplex Z ); float Getimag( cpmplex Z ); // 返回复数 Z 的虚部值 void add( complex z1, complex z2, complex &sum ); // 以 sum 返回两个复数 z1, z2 的和

{ 其它省略 } // -----基本操作的实现 void add( complex z1, complex z2, complex &sum ) { // 以 sum 返回两个复数 z1, z2 的和 sum.realpart = z1.realpart + z2.realpart; sum.imagpart = z1.imagpart + z2.imagpart; } { 其它省略 }

1.3 算法和算法的衡量 一、算法 二、算法设计的原则 三、算法效率的衡量方法和准则 四、算法的存储空间需求

一、算法 算法是为了解决某类问题而规定的一个有限长的操作序列。一个算法必须满足以下五个重要特性: 1.有穷性 2.确定性 3.可行性 4.有输入 5.有输出

1.有穷性 对于任意一组合法输入值,在执行有穷步骤之后一定能结束,即: 算法中的每个步骤都能在有限时间内完成。 2.确定性 对于每种情况下所应执行的操作,在算法中都有确切的规定,使算法的执行者或阅读者都能明确其含义及如何执行。并且在任何条件下,算法都只有一条执行路径。

3.可行性 算法中的所有操作都必须足够基本,都可以通过已经实现的基本操作运算有限次实现之。 4.有输入 作为算法加工对象的量值,通常体现为算法中的一组变量。有些输入量需要在算法执行过程中输入,而有的算法表面上可以没有输入,实际上已被嵌入算法之中。

5.有输出 它是一组与“输入”有确 定关系的量值,是算法进行信息加工后得到的结果,这种确定关系即为算法的功能。

二、算法设计的原则 设计算法时,通常应考虑达到以下目标: 1.正确性 2. 可读性 3.健壮性 4.高效率与低存储量需求

1.正确性 首先,算法应当满足以特定的“规格说明”方式给出的需求。 其次,对算法是否“正确”的理解可以有以下四个层次: a.程序中不含语法错误; b.程序对于几组输入数据能够得出满足要求的结果;

通常以第 c 层意义的正确性作为衡量一个算法是否合格的标准。 d.程序对于一切合法的输入数据都能得出满足要求的结果; 通常以第 c 层意义的正确性作为衡量一个算法是否合格的标准。

2. 可读性 算法主要是为了人的阅读与交流, 其次才是为计算机执行,因此算法应该易于人的理解;另一方面,晦涩难读的程序易于隐藏较多错误而难以调试。

3.健壮性 当输入的数据非法时,算法应当恰当地作出反映或进行相应处理,而不是产生莫名奇妙的输出结果。并且,处理出错的方法不应是中断程序的执行,而应是返回一个表示错误或错误性质的值,以便在更高的抽象层次上进行处理。

4.高效率与低存储量需求 通常,效率指的是算法执行时间; 存储量指的是算法执行过程中所需的 最大存储空间,两者都与问题的规模 有关。

三、算法效率的 衡量方法和准则 通常有两种衡量算法效率的方法: 事后统计法 缺点:1.必须执行程序 2.其它因素掩盖算法本质 事前分析估算法

和算法执行时间相关的因素: 1.算法选用的策略 2.问题的规模 3.编写程序的语言 4.编译程序产生的机器代码的质量 5.计算机执行指令的速度

一个特定算法的“运行工作量” 的大小,只依赖于问题的规模(通常用整数量n表示),或者说,它是问题规模的函数。

T (n) = O(f(n)) 假如,随着问题规模 n 的增长,算法执行时间的增长率和 f(n) 的增长率相同,则可记作:

如何估算 算法的时间复杂度?

算法的执行时间 = 算法的执行时间 与 原操作执行次数之和 成正比 算法 = 控制结构 + 原操作 (固有数据类型的操作) 原操作(i)的执行次数×原操作(i)的执行时间 算法的执行时间 与 原操作执行次数之和 成正比

从算法中选取一种对于所研究的问题来说是 基本操作 的原操作,以该基本操作 在算法中重复执行的次数 作为算法运行时间的衡量准则。

void mult(int a[], int b[], int& c[] ) { for (i=1; i<=n; ++i) 例 一 两 个 矩 阵 相 乘 void mult(int a[], int b[], int& c[] ) { // 以二维数组存储矩阵元素,c 为 a 和 b 的乘积 for (i=1; i<=n; ++i) for (j=1; j<=n; ++j) { c[i,j] = 0; for (k=1; k<=n; ++k) c[i,j] += a[i,k]*b[k,j]; } //for } //mult 基本操作: 乘法操作 时间复杂度: O(n3)

void select_sort(int& a[], int n) { // 将 a 中整数序列重新排列成自小至大有序的整数序列。 例 二 选 择 排 序 for ( i = 0; i< n-1; ++i ) { if ( j != i ) a[j] ←→ a[i] } j = i; // 选择第 i 个最小元素 for ( k = i+1; k < n; ++k ) if (a[k] < a[j] ) j = k; 基本操作: 比较(数据元素)操作 时间复杂度: O(n2)

基本操作: 赋值操作 时间复杂度: O(n2) 例 void bubble_sort(int& a[], int n) { 三 起 泡 排 序 void bubble_sort(int& a[], int n) { // 将 a 中整数序列重新排列成自小至大有序的整数序列。 for (i=n-1, change=TRUE; i>1 && change; --i) } // bubble_sort { change = FALSE; // change 为元素进行交换标志 for (j=0; j<i; ++j) if (a[j] > a[j+1]) { a[j] ←→ a[j+1]; change = TRUE ;} } // 一趟起泡 基本操作: 赋值操作 时间复杂度: O(n2)

算法的空间复杂度定义为: S(n) = O(g(n)) 四、算法的存储空间需求 表示随着问题规模 n 的增大, 算法运行所需存储量的增长率

算法的存储量包括: 1.输入数据所占空间 2.程序本身所占空间 3.辅助变量所占空间

若输入数据所占空间只取决于问题 若所需额外空间相对于输入数据量 本身,和算法无关,则只需要分析除 输入和程序之外的辅助变量所占额外 空间。 来说是常数,则称此算法为原地工作。 若所需存储量依赖于特定的输入, 则通常按最坏情况考虑。

本章学习要点 1. 熟悉各名词、术语的含义,掌握基本概念。 2. 理解算法五个要素的确切含义。 3. 掌握计算语句频度和估算算法时间复杂度的方法。