Download presentation
Presentation is loading. Please wait.
Published byAlexina Hancock Modified 5年之前
1
汪卫 王轶彤 weiwang1@fudan.edu.cn 55664657 老逸夫楼602-3
数据库新技术 汪卫 王轶彤 老逸夫楼602-3
2
课程目的 了解数据库领域的发展方向 了解数据库领域的主要方向 课程内容 数据库管理实现技术 时空数据管理 流数据处理 数据库安全
WEB数据管理 图数据管理 …
3
数据库管理系统技术的发展动力 数据库系统性能和功能的增强 数据的深层次应用 各种新的数据形式 结合ERP等新的应用
文本数据 XML数据 多媒体数据 图结构数据 流数据 … 结合ERP等新的应用 同WEB、生物信息学等新技术的结合
4
数据库技术研究概览 数据库管理系统技术 数据库技术的新应用 新的数据类型
5
数据库系统核心技术 Database Architectures Data model/language Storage
Basic query operator Query Optimization Transaction Performance Cache Management
6
数据库系统核心技术 Index Security Recovery Concurrency Compression
1995,1993,1990 Concurrency 1986 Compression Advanced query Views
7
Database Architectures
2009,2008,2006,2005(2),2004,1998,1993,1990 新的计算机结构 对多线程的支持 手持设备 多核 SOA Grid 图形加速卡 新的技术 按列存储 云计算 数据复制
8
Data model/language 2004,1990 面向对象数据模型 查询语言表达能力分析 针对新的数据类型的描述与查询
9
Storage 2009,2008,2003,2002,1995(2),1993,1990, 1988,1986 数据在各种设备上的存储方法
硬盘 内存 移动设备 Flash 顺序读和随机读取速度接近内存 写操作速度慢 擦写的次数有限制
10
Basic query operator 2006,2005, 2004,1998,1990,1986 提高查询性能的基本单元 新的思路
针对大规模数据的要求
11
Query Optimization 并行查询优化
2009,2008,2006,2005(2),2004,2003,2002,2001,2000, 1998,1995,1993,1990,1988 数据库厂商的核心技术 代价的估计 操作执行的顺序 新的查询技术 字符串 区间数据 图数据 Topk查询 并行查询优化 并行机 多核
12
Transaction 2006,2002,1995,1993,1990(2),1988(2) 集中式数据库中的事务处理
分布式数据库中的事务处理 工作流领域的事务处理 长事务处理
13
Cache Management 2006,2005,2003,2001 XML查询中的cache管理 Cache的评价模型 访问模式挖掘
压缩
14
Index … 数据库中的基本技术
15
Performance 2008,2006,2005,2003,1988 各种系统的性能评测 针对不同目标的性能提高 通过压缩日志实现恢复
大量读操作 物理设计 通过压缩日志实现恢复
16
Security 2009,2008,2006,2005,2004,2002(2),1995 访问控制 数据库审计 隐私保护
数据匿名化处理 元组 集合 社会网络 Outsourcing database
17
Compression 2009,2008,2006,2004 解决大规模数据的处理问题 如何在压缩的数据上进行查询
18
Advanced query 2009, 2008,2006,2004(3),2001,2000,1998, Top-k 最近邻
非确定数据/Approximate Match Skyline 一种新的数据查询方法 索引结构 全空间 子空间 流数据 并行计算 …
19
Views 2008, 2006,2005,2001 数据库系统的基本功能 提高大规模数据访问性能的基本手段 物化视图 视图的选择
视图的维护、更新 通过视图进行修改 Rank
20
各种不同类型的数据库系统 Object-oriented database Knowledge database ,
1995(2),1993,1990,1988,1986 Knowledge database , 1993,1990(3),1988(2),1986 Parallel database 1995,1993 Active database 1995
21
新的数据应用方式 Data warehouse/OLAP Data Mining/knowledge discovery Stream
Information Integration/Heterogeneous Skyline Querying Summarization DB and IR Peer-to-Peer and Distributed Computing New Application
22
Datawarehouse/OLAP 2009,2008,2006,2005,2003,2002,2001,2000,1998 数据仓库的结构 物化视图 基本的查询操作 数据的来源分析 数据立方体的组织技术 数据立方体的索引技术 复杂的数据类型 非精确的数据立方体 数据质量/血统分析 不同类型的数据 序列
23
Data Mining/knowledge discovery
2009,2008,2006,2005,2003(2),2002,2001,2000(3),1998(4), 1995(2) 数据挖掘 关联规则 分类 聚类 同应用领域相结合的数据挖掘方法 生物数据 WEB数据/WEB使用数据 序列数据 不同的数据源 多数据库 XML数据
24
Information Integration/ Heterogeneous
2008,2007,2006,2005(2),2002,2001,2000(2),1998,1995,1993,1990 异构数据库的管理 多数据库 联邦数据库 数字图书馆 Deep Web 模式匹配、映射与转换 非结构化数据的处理 Benchmark 可视化 映射设计
25
Stream 2008,2007,2006,2005(2),vldb 2004(4)2003(2),2002(2) 流数据 应用背景
只能对数据处理一遍 只能使用有限的资源 应用背景 系统监控 海量数据的处理 传感器网络 研究内容 数据管理与查询 数据挖掘 变化发现 负载处理 事件发现 新的数据形式 XML Uncertain data
26
Summarization 2005 用少量的数据描述大量的信息 MDL Histograms Wavelet
27
DB and IR 2009,2008,2006,2005(2),2002,1995 数据库内各种信息检索技术 基于本体的查询 新的距离公式
时间序列 关键字检索 多属性检索 基于本体的查询 新的距离公式 Entity
28
Peer-to-Peer and Distributed Computing
2006,2005, 2004,2001,1995,1993,1986 起源于分布式数据库 同集中式的数据库存在很大差别 针对数据库的各种操作需要重新考虑 WEB Service管理与访问
29
New Applications 2005,2002,2001,1993,1986 数据库研究的推动力 科学数据库 生物信息数据库 ERP
Senser Network/RFID Grid
30
新的数据类型 XML Text Document Bio data Spatio-Temporal Query Processing WEB
Social Network Multi-media database 2000,1998,1995
31
XML 2008,2007,2006,2005(4),2004(3)2003(4),2002(2),2001(2) XML数据是一种基于树(或有向无环图)模型的数据 XML数据的存储技术 存储结构 索引 基于结构的索引结构 基于数据的索引结构 XML数据的查询方法 小枝连接 代价估计 XML数据的修改 XML流数据的查询 XML数据的规范化 XML数据同传统数据库的结合 关键词检索
32
文本数据管理 2005, 2000,1998,1988 一种最常见的数据类型 数据集成的需要 文本数据同数据库技术的结合
33
Spatio-Temporal Query Processing
2008,2006,2005,2003,2001(2),2000,1998,1995,1990 数据管理领域的一种常见的数据类型 时空数据的查询 查询语言 查询方法 时空数据的存储、组织技术 时空数据的索引技术 移动对象的管理 公路网数据 轨迹数据 包含时间特性的数据库数据管理
34
WEB数据管理 2009,2004,2003,2002(2),2001,2000(2) WEB数据建模 WEB数据管理 WEB数据的评分
35
Multi-media database 2000,1998,1995 多媒体数据的建模 多媒体数据的语义提取
36
Uncertain data and Probabilistic database
2009,2008,2007 数据来源 信息集成 数据质量 数据采集 RFID 主要研究内容 查询处理 最近邻计算 图数据 访问控制
37
图数据管理 2009,2008,2007,2006,2005 两种类型图数据 主要问题 小图集合 大图 查询处理 图的索引结构 关键词检索
过滤 子图匹配 图的索引结构 关键词检索
Similar presentations