Presentation is loading. Please wait.

Presentation is loading. Please wait.

报告人:霍江涛 2011-11-26 网络与移动数据管理实验室. XML 数据库简介 XML 数据库是一种支持对 XML 格式文档进行存储和查 询等操作的数据管理系统。 XML 管理系统主要有两种类型: ( 1 )支持 XML 的数据库。如 ORACLE , DB2 , SQL Server ( 2.

Similar presentations


Presentation on theme: "报告人:霍江涛 2011-11-26 网络与移动数据管理实验室. XML 数据库简介 XML 数据库是一种支持对 XML 格式文档进行存储和查 询等操作的数据管理系统。 XML 管理系统主要有两种类型: ( 1 )支持 XML 的数据库。如 ORACLE , DB2 , SQL Server ( 2."— Presentation transcript:

1 报告人:霍江涛 2011-11-26 网络与移动数据管理实验室

2 XML 数据库简介 XML 数据库是一种支持对 XML 格式文档进行存储和查 询等操作的数据管理系统。 XML 管理系统主要有两种类型: ( 1 )支持 XML 的数据库。如 ORACLE , DB2 , SQL Server ( 2 ) Native XML 数据库。 MarkLogic,DBDOM,OrientX 等

3 XML 数据库概述 ( 1 ) MarkLogic Native XML Database 的代表,该数据库广泛应用于出版行业。例如: BusinessWeek (商业周刊)、 McGraw-Hill Education 、约翰威立父子 出版公司等等。 (2)Oracle XML DB XML-Enabled Database 的代表。 该数据库已经成功应用于以下企业: Northern California Power Agency ( NCPA ), 加州立法顾问局,Warner Music Group ( WMG ) (3)Sedna 开源的 XML 数据库的代表。 Sedna DBMS 是一个原生的 XML 数据库 (NXD) 管理系统, 最早由俄罗斯科 学院系统程序研究所 MODIS 小组开发的。 Sedna 实现了 XQuery ,并且专 门为这个语言开发了他的数据模型拓展技术。 (4)OrientX OrientX 是国内具有独立知识产权的 XML 数据库的代表 。

4 XML 数据库测试概述 通过采用一套评测基准,对 XML 数据库的基础功能进行测 试。 XML 数据库测试分类: 文档的导入导出: 通过测试不同大小文档的导入导出时间, 分析各系统数据存取的效率及其伸缩性。 功能测试:设计大约 1000 个用例,(包括: XPath, XQurey, XQurey/Update )测试各系统对这些语言的支持 程度 性能测试:设计专门的测试用例,来比较系统特定点上的 性能。 事务并发测试:根据 TPox 测试基准,通过多个用户同时 不断的对数据库进行查询、插入、删除、更改来模拟并发。

5 XML 评测基准 1 、 X007 基准测试 2 、 Xmach-1 基准测试 3 、 Xmark 基准测试 4 、 TPoX 基准测试 5 、 XPathMark 基准测试 6 、 Michigan 基准测试

6 测试基准的比较

7 测试环境配置

8 基础功能测试概述 测试选用 XMark 测试基准,测试的数据均由 XMark 数据生 成工具自动生成,数据大小有两种 33KB 和 10MB 。小数据 主要用于简单功能测试,其好处是容易分析结果是否和预 期一致。大数据主要用于复杂的 XQuery 查询,如连接、分 组、排序等功能,大数据在一定程度上可以保证复杂查询 结果不为空。 基础功能测试主要测试的是数据库系统的基本操作和对 W3C 标准的支持程度。基础功能测试共有 1200 多个测试用 例,基本上涵盖了 W3C 中 XPath , XQuery , XQuery/Update 三方面所有的功能。通过测试用例的总体 通过率,可以基本了解四种数据库对 W3C 标准的支持程度。 然后通过对 XPath 、 XQuery 、函数分别进行分析,了解四 种数据库对各部分的支持程度。由于 XQuery/Update 是推 荐标准,在此不单独分析。

9 基础功能测试用例

10

11 总体测试结果

12 总体测试结果分析 从整体状况上来看,测试项目共分为 43 类, 1210 个测 试点,包含了作为 XML 数据库所应该支持的基本操作 和 W3C 标准的测试点 从结果上看, Sedna 的正确结果最多达到 1156 个,整 体通过率为 95.54% ,其次是 MarkLogic Server 达到 1145 个,整体通过率为 94.63% , Oracle XML DB 达到 1079 个,整体通过率为 89.17% ,最后是 OrientX 为 81 个,整体通过率为 6.69%

13 Xpath 测试结果

14

15 Xpath 测试结果分析 在 XPath 支持情况中,支持最好的依次是 Sedna , MarkLogic Server , Oracle XML DB , OrientX 。可以 看出 Sedna 和 MarkLogic Server 支持率为 100% 的大类的 比例要高于 Oracle XML DB 。这可能是因为前两者是 专门针对 xml 的数据库系统,而 Oracle XML DB 要建立 在其复杂的关系数据库基础之上,难免会有包袱。

16 Xquery 测试结果及分析

17 在 XQuery 支持情况中,支持最好的依次是 Sedna , MarkLogic Server , Oracle XML DB , OrientX 。 XQuery 查询引擎是 XML 数据库系统的核心部分,但由 于 XQuery 语言本身比较复杂, xml 数据库系统技术也 没有关系数据库那么成熟,所以各个数据库对 XQuery 的支持并不完美。

18 函数处理测试结果及分析

19

20 XQuery 包含 100 多个内置函数,它们主要针对字符串、 数值、日期和时间的比较和相互转化,对 node 和 QName 的操作,序列操作,布尔值等等。 在函数处理支持情况中,支持最好的依次是 MarkLogic Server , Sedna , Oracle XML DB , OrientX 。

21 总结 1 、各个 XML 数据库都有自己的优势和不足。 2 、测试是一项有技术性和技巧性的工作。 2 、搞研究重在做精的基础上求博。 3 、要动手多实践。

22


Download ppt "报告人:霍江涛 2011-11-26 网络与移动数据管理实验室. XML 数据库简介 XML 数据库是一种支持对 XML 格式文档进行存储和查 询等操作的数据管理系统。 XML 管理系统主要有两种类型: ( 1 )支持 XML 的数据库。如 ORACLE , DB2 , SQL Server ( 2."

Similar presentations


Ads by Google