Database Principles & Applications

Slides:



Advertisements
Similar presentations
第六章 查询处理 6.1 查询处理概述 6.2 代价估算 6.3 基本运算的实现 6.4 表达式计算 6.5 关系表达式转换 6.6 选择执行计划.
Advertisements

SQL的简单查询.
数据库系统概论 华中科技大学能源与动力工程学院
第5章 查询处理和优化 5.1 引言 5.2 代数优化 5.3 依赖于存取路径的规则优化 5.4 代价估算优化*
高等院校计算机教材系列 数据库原理与应用(第2版) 任课教师:刘雅莉
初级会计电算化 (用友T3) 制作人:张爱红.
计算机应用基础 上海大学计算中心.
Database Principles & Applications
数据库原理 Database Principles 第五章 数据库完整性 Database Principles.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
不确定度的传递与合成 间接测量结果不确定度的评估
加减法解二元一次方程组 肇庆市睦岗镇大龙学校 彭素冉.
在PHP和MYSQL中实现完美的中文显示
第四章 关系系统及其查询优化 这一章包括两个内容,一是关系系统(关系数据库系统的简称),二是关系系统的查询优化。第一部分讨论关系系统的定义和分类;第二部分讨论关系系统中查询优化的概念、查询优化的基本原理和技术。
第九章 字符串.
作业4讲评.
Hadoop I/O By ShiChaojie.
数据库技术 第三章 关系数据库标准语言SQL 中国科学技术大学网络学院 阚卫华.
Chap 10 SQL定義、操作與控制指令.
An Introduction to Database System An Introduction to Database System
管理信息结构SMI.
SQL Injection.
走进编程 程序的顺序结构(二).
元素替换法 ——行列式按行(列)展开(推论)
国家“十一五”规划教材 数据库原理与应用教程(第3版).
SQL SERVER 一些经典语句 1.
SPARQL若干问题的解释 刘颖颖
段磊 王慧锋 TEL: qq群: 数据库系统原理课程设计 实验环节2 段磊 王慧锋 TEL: qq群:
第17章 网站发布.
中国科学技术大学计算机系 陈香兰(0551- ) Spring 2009
《编译原理与技术》 期末复习 计算机科学与技术学院 郑启龙 李 诚 25/12/2018.
使用矩阵表示 最小生成树算法.
Unit 11.Operating System 11.1 What’s OS 11.2 Related Courses
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
C++语言程序设计 C++语言程序设计 第七章 类与对象 第十一组 C++语言程序设计.
C语言程序设计 主讲教师:陆幼利.
顺序表的删除.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第二章 Java基本语法 讲师:复凡.
VB与Access数据库的连接.
Web安全基础教程
Thanks for the Slides from Renmin U
iSIGHT 基本培训 使用 Excel的栅栏问题
第八讲 SQL语言之数据查询(2) 第三讲 SQL Server 2000 数据库技术.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.把下面的关系模式转化为E-R图 1)系(系号,系名,电话) 2)教师(工号,姓名,性别,年龄,系号)
College of Computer Science & Technology
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
Visual Basic程序设计 第13章 访问数据库
上杭二中 曾庆华 上杭二中 曾庆华 上杭二中 曾庆华.
基于规则抽取的时间表达式识别 -英文Ⅲ 高冠吉.
SpringerLink数据库使用说明 上海师范大学图书馆
实验目的:掌握数据的顺序存储结构及它们在计算机中的操作。 实验内容:
基于列存储的RDF数据管理 朱敏
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
Chinese Virtual Observatory
VB与Access数据库的连接.
WEB程序设计技术 数据库操作.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
資料庫應用與實作 一到六章重點、習題.
基于MapReduce的Knn连接方法 ----谢荣东论文观点展示.
看圆如何七十二变 微建筑早课.
使用Fragment 本讲大纲: 1、创建Fragment 2、在Activity中添加Fragment
§4.5 最大公因式的矩阵求法( Ⅱ ).
入侵检测技术 大连理工大学软件学院 毕玲.
最小生成树 最优二叉树.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
第4章 关系系统及其查询优化 关系系统 关系系统的查询优化 关系系统的分类 关系系统及其查询优化 查询优化的一般准则 关系代数等价变换规则
厦门大学计算机科学系本科生课程 《数据库系统原理》 第9章 数据库查询优化 (2017版) 林子雨 厦门大学计算机科学系
Presentation transcript:

Database Principles & Applications 数据库原理及应用 Database Principles & Applications 第九章 关系查询处理和查询优化 辽宁师范大学计信学院

第九章 关系系统及其查询优化 9.1 关系数据库系统的查询处理 9.2 关系数据库系统的查询优化 9.3 代数优化 9.4 物理优化

关系系统及其查询优化(续) 本章目的: RDBMS的查询处理步骤 查询优化的概念 基本方法和技术 查询优化分类 : 代数优化 物理优化

9.1 关系数据库系统的查询处理 9.1.1 查询处理步骤 9.1.2 实现查询操作的算法示例

9.1.1 查询处理步骤 RDBMS查询处理阶段 : 1. 查询分析 2. 查询检查 3. 查询优化 4. 查询执行

查询处理步骤(续) 查询处理步骤

1. 查询分析 对查询语句进行扫描、词法分析和语法分析 从查询语句中识别出语言符号 进行语法检查和语法分析

2. 查询检查 根据数据字典对合法的查询语句进行语义检查 根据数据字典中的用户权限和完整性约束定义对用户的存取权限进行检查 检查通过后把SQL查询语句转换成等价的关系代数表达式 RDBMS一般都用查询树(语法分析树)来表示扩展的关系代数表达式 把数据库对象的外部名称转换为内部表示

3. 查询优化 查询优化:选择一个高效执行的查询处理策略 查询优化分类 : 代数优化:指关系代数表达式的优化 物理优化:指存取路径和底层操作算法的选择 查询优化方法选择的依据: 基于规则(rule based) 基于代价(cost based) 基于语义(semantic based)

4. 查询执行 依据优化器得到的执行策略生成查询计划 代码生成器(code generator)生成执行查询计划的代码

9.1 关系数据库系统的查询处理 9.1.1 查询处理步骤 9.1.2 实现查询操作的算法示例

9.1.2 实现查询操作的算法示例 一、 选择操作的实现 二、 连接操作的实现

一、 选择操作的实现 【例1】Select * from student where <条件表达式> ; 考虑<条件表达式>的几种情况: C1:无条件; C2:Sno='200215121'; C3:Sage>20; C4:Sdept='CS' AND Sage>20;

选择操作的实现(续) 选择操作典型实现方法: 1. 简单的全表扫描方法 对查询的基本表顺序扫描,逐一检查每个元组是否满足选择条件,把满足条件的元组作为结果输出 适合小表,不适合大表 2. 索引(或散列)扫描方法 适合选择条件中的属性上有索引(例如B+树索引或Hash索引) 通过索引先找到满足条件的元组主码或元组指针,再通过元组指针直接在查询的基本表中找到元组

选择操作的实现(续) [例1-C2]以C2为例,Sno=‘200215121’,并且Sno上有索引(或Sno是散列码) 通过元组指针在student表中检索到该学生 [例1-C3]以C3为例,Sage>20,并且Sage上有B+树索引 使用B+树索引找到Sage=20的索引项,以此为入口点在B+树的顺序集上得到Sage>20的所有元组指针 通过这些元组指针到student表中检索到所有年龄大于20的学生。

选择操作的实现(续) [例1-C4]以C4为例,Sdept=‘CS’AND Sage>20,如果Sdept和Sage上都有索引: 算法一:分别用上面两种方法分别找到Sdept=‘CS’的一组元组指针和Sage>20的另一组元组指针 求这2组指针的交集 到student表中检索 得到计算机系年龄大于20的学生 算法二:找到Sdept=‘CS’的一组元组指针, 通过这些元组指针到student表中检索 对得到的元组检查另一些选择条件(如Sage>20)是否满足 把满足条件的元组作为结果输出。

二、 连接操作的实现 连接操作是查询处理中最耗时的操作之一 本节只讨论等值连接(或自然连接)最常用的实现算法 【例2】 SELECT * FROM Student,SC WHERE Student.Sno=SC.Sno;

连接操作的实现(续) 1. 嵌套循环方法(nested loop) 2. 排序-合并方法(sort-merge join 或merge join) 3. 索引连接(index join)方法 4. Hash Join方法

连接操作的实现(续) 嵌套循环方法(nested loop) 对外层循环(Student)的每一个元组(s),检索内层循环(SC)中的每一个元组(sc) 检查这两个元组在连接属性(sno)上是否相等 如果满足连接条件,则串接后作为结果输出,直到外层循环表中的元组处理完为止

连接操作的实现(续) 2. 排序-合并方法(sort-merge join 或merge join) 适合连接的诸表已经排好序的情况 排序-合并连接方法的步骤: 如果连接的表没有排好序,先对Student表和SC表按连接属性Sno排序 取Student表中第一个Sno,依次扫描SC表中具有相同Sno的元组

连接操作的实现(续) 200215121 200215122 200215123 200215124 . 200215121 1 92 200215121 2 85 200215121 3 88 200215122 2 90 200215122 3 80 排序-合并连接方法示意图

连接操作的实现(续) 排序-合并连接方法的步骤(续): 当扫描到Sno不相同的第一个SC元组时,返回Student表扫描它的下一个元组,再扫描SC表中具有相同Sno的元组,把它们连接起来 重复上述步骤直到Student 表扫描完

连接操作的实现(续) Student表和SC表都只要扫描一遍 如果2个表原来无序,执行时间要加上对两个表的排序时间 对于2个大表,先排序后使用sort-merge join方法执行连接,总的时间一般仍会大大减少

连接操作的实现(续) 3. 索引连接(index join)方法 步骤: ① 在SC表上建立属性Sno的索引,如果原来没有该索引 ② 对Student中每一个元组,由Sno值通过SC的索引查找相应 的SC元组 ③ 把这些SC元组和Student元组连接起来 循环执行②③,直到Student表中的元组处理完为止

连接操作的实现(续) 4. Hash Join方法 把连接属性作为hash码,用同一个hash函数把R和S中的元组散列到同一个hash文件中 步骤: 划分阶段(partitioning phase): 对包含较少元组的表(比如R)进行一遍处理 把它的元组按hash函数分散到hash表的桶中 试探阶段(probing phase):也称为连接阶段(join phase) 对另一个表(S)进行一遍处理 把S的元组散列到适当的hash桶中 把元组与桶中所有来自R并与之相匹配的元组连接起来

连接操作的实现(续) 上面hash join算法前提:假设两个表中较小的表在第一阶段后可以完全放入内存的hash桶中 以上的算法思想可以推广到更加一般的多个表的连接算法上