OrientX4.0系统开发报告 XML Group July 25, 2009.

Slides:



Advertisements
Similar presentations
校园及周边治安防范 暨应急预案桌面演练 实 训 乐山应急管理学会 贾 伟. 目 录 校园治安问题包含的内容 校园治安问题的特点 避免引发校园治安问题的对策 校园应急预案桌面演练实训 校园治安问题的成因.
Advertisements

“ 我不能 上学了,我 每天还要帮 家里拾柴火 呢。 ” 给远方的小学生写一封信 书信的基本格式: 开头顶格写称呼,打上冒号; 换行空两格写问候语; 接下来换行空两格写正文部分; 正文结束后,换行写祝颂语; 最后在右下方写上寄信人姓名和 写信日期。
index 目次 ( 請按一下滑鼠,解答就會出現喔 !) 接續下頁解答 3-1 極限的概念.
中醫藥就醫用藥 - 婦女篇 中醫藥安全衛生教育資源中心 中醫藥就醫用藥百分百、就是藥做到: 停、看、聽、選、用專業.
Ingenta. Ingenta 学术信息平台简介 Ingenta 网站是 Ingenta 公司于 1998 年建成的学术信息平台。在几年 的发展中,该公司先后兼并了多家信息公司,合并了这些公司的 数据库。 2001 年, Ingenta 公司兼并了 Catchward 公司,近期 Ingenta.
天水圍的體育設施.
第八章 負債 8-1 負債之意義及內容 8-2 流動負債 8-3 長期負債 8-4 其他負債.
報告者:蕭曄鴻 班級:溫馨甲孝 指導教授:李開濟博士
單元名稱: 健康的兩性交往.
党的十八届四中全会 依法治国精神解读. 党的十八届四中全会 依法治国精神解读 一、十八届四中全会概况 中国共产党第十八届中央委员会第四次全体会议,于2014年10月20日至23日在北京举行。 全会审议通过了《中共中央关于全面推进依法治国若干重大问题的决定》。
定海区渔农村集体资产 股份合作制改革工作 档案管理培训班
肌肉、骨骼、關節 傷害急救 組員: 499i0014 高藝庭 499i0017 徐育敏 499i0022 林佳瑩 499i0048 詹謹禎
职业教育.课程改革.项目课程 江苏省太仓中等专业学校校长 江苏省职业教育教学改革创新指导委员会委员 江苏省职业教育课程开发研究中心组组长
证券市场法律制度与监督管理 作者:张学亮.
香港扶貧計劃 關愛基金 Group 5 組員 馬曉真 余葆 董賽騫 蕭雪兒.
第八讲 招标书 投标书 要点:各自概念 内容与格式.
10-1 資料庫管理系統簡介 10-2 關聯式資料模式和查詢語言 10-3 Access 簡介 10-4 XML 簡介
我怀念的乡村记忆 陈秀华 社会工作0841.
实际问题与一元二次方程(一).
医学文献和文献检索概论 哈尔滨医科大学图书馆 下一页.
沟通技巧 主讲:涂育俊.
三生教育 ----课程与教学 省电教馆馆长 硕士生导师 罗文 研究员.
數位芝麻網路公司( 軟體工程師
一、會計循環之意義 二、會計憑證概要 三、日記簿概要 四、分類帳概要
数据库概述 简而言之,数据库(DataBase)就是一个存储数据的仓库。为了方便数据的存储和管理,它将数据按照特定的规律存储在磁盘上。通过数据库管理系统,可以有效的组织和管理存储在数据库中的数据。如今,已经存在了Oracle、SQL Server、MySQL等诸多优秀的数据库。在这一章中将讲解的内容包括。
第三課 宗教(倫理)的獨特向度 單元 3.2 全球倫理:兩項原則和四項座右銘
教育研究成果的生成与呈现 曾继耘 北京师范大学 博士 山东师范大学 教授.
第7章 行政监督.
科學與科技課程 教師分享會 二OO四年五月七日.
XML 第05讲 使用CSS显示XML.
P T P 大学生法制教育 保卫处.
營建自動化 -營建管理資訊化 授課老師:劉俊杰 副教授 中華民國89年9月27日.
毕业答辩PPT模板 答辩人: XXX 指导老师: XX教授
让微笑伴您一生.
陈 汉 文 厦门大学会计系 主任 经济学教授 博士生导师
我真的很不想活,日子過得太沒有意思了。. 我真的很不想活,日子過得太沒有意思了。 聽起來,你現在的日子真難熬,你 願意說說看為什麼嗎?
老员工心态管理.
前不久看到了这样一则报道:某个大学校园里,一个大学生出寝室要给室友留一张字条,告诉他钥匙放在哪里。可是“钥匙”两个字他不会写,就问了其他寝室的同学,问了好几个,谁也不会写,没办法,只好用“KEY”来代替了。 请大家就此事发表一下自己看法。
实践 课题 周围环境对当代大学生成长的影响 指导老师:王永章 小组成员:陈荣、刘若楠、张红艳、吕雪丹、樊金芳、李惠芬、黄婧
世界看遍 终归回到纯水岸 波托菲诺08年终总结. 世界看遍 终归回到纯水岸 波托菲诺08年终总结.
《XML技术及其应用》 第1章 XML 基础知识 主讲教师:桂浩 武汉大学.
利用共同供應契約 辦理大量訂購流程說明.
產品責任險的意義 想一想,什麼是「產品責任險」? Q
LOGO 微立体清新风工作汇报 工作总结/销售汇报/工作计划/新年工作计划/阶段工作汇报
XML数据管理技术 周军锋.
第 六 章 鏈結串列(Link List) 課程名稱:資料結構 授課老師:________ 2019/1/2.
XML Scheam 也是用來驗證XML文件的驗證語法.
第六章 安全衛生工作守則 6-1 前 言  6-2 訂定依據相關法令規定  6-3 工作守則製作程序及製作前應注意事項  6-4 如何訂定適合需要之安全衛生工作守則  6-5 結 論.
Science and technology report service systemUsage method
<title> XML與XQuery ,新一代資料儲存標準 </title>
SOA – Experiment 2: Query Classification Web Service
Native-XML Database --Xindice 廖逸.
古诗鉴赏.
第 15 章 SAX程式設計.
XML查询处理技术简介 周军锋.
OrientX3.0及其改进之处 XML小组.
Chapter8 搜尋引擎之使用 網路應用入門(一) Chapter8 搜尋引擎之使用
电子资源检索入门 杜少霞 2015年9月17日.
參考資料: 黃慕萱,Chap. 2-3 Harter, Chap. 3
兒童及少年保護、 家庭暴力及性侵害事件、 高風險家庭 宣導與通報
單元4-2: XPATH 範例 王豐緒 銘傳大學資工系.
喜雨亭記 國二甲 S 陳姿婷.
第15章 SAX2建立XML應用程式 15-1 SAX2的基礎 15-2 使用VB建立SAX應用程式 15-3 應用實例:顯示XML文件
北京市药品阳光采购培训会 遴选、交易系统介绍
僅首頁出現本title即可 責任的故事(二年級) 生命最美麗動人的本能 簡報製作:瑞柑國民小學 鄭雙慧 文/ 何秀芳.
基于列存储的RDF数据管理 朱敏
Mobile Nodes and Multiple Interfaces in IPv6 (Monami6)
技專校院多元入學管道 國立臺北科技大學 教務處 涂雅筑.
OrientX暑期工作总结及计划 XML Group
西南科技大学网络教育系列课程 动态网页设计(JSP) 补充 JSP操作XML文件.
Presentation transcript:

OrientX4.0系统开发报告 XML Group July 25, 2009

XML Keyword Search Keyword: Stevens, Addison-Wesley <?xml version="1.0" encoding="GB2312"?> <bib> <book year="1994"> <title>TCP/IP Illustrated</title> <author> <last>Stevens</last> <first>W.</first> </author> <publisher>Addison-Wesley</publisher> <price>65.95</price> </book> ...... <book year="1992"> <title>Advanced Programming in the Unix environment</title> Keyword: Stevens, Addison-Wesley <book year="1994"> <title>TCP/IP Illustrated</title> <author> <last>Stevens</last> <first>W.</first> </author> <publisher>Addison-Wesley</publisher> <price>65.95</price> </book> <book year="1992"> <title>Advanced Programming in the Unix environment</title> <author> <last>Stevens</last> <first>W.</first> </author> <publisher>Addison-Wesley</publisher> <price>65.95</price> </book>

大纲 OrientX4.0已完成的工作 XML文档的SAX解析 XML文档的Dewey编码 存储和索引 SLCA 算法的实现

大纲 OrientX4.0已完成的工作 XML文档的SAX解析 XML文档的Dewey编码 存储和索引 SLCA 算法的实现

OrientX4.0系统结构 Data manager Schema Manager Index Storage XML Documents Query Result Query/ Keywords Update XPath Data Definition Address Records XQuery Element Node Keyword-search Coder Execute Engine xml文档的解析 Storage Manager

SAX简介 SAX(Simple API for XML) SAX是一种解析XML文件的技术。 SAX是一组程序接口。 使用事件基础来处理XML文件,目前大部分XML解析器除了支持DOM外,都会一并支持SAX解析。 SAX是一组程序接口。 可以将XML文件视为字符串流的数据,在读取XML元素时触发一系列事件,只需撰写所需的事件处理程序,就可以分析或取得XML元素。

SAX 图例 XML文件在经过SAX解析后,产生一系列事件,我们可以建立事件处理程序来处理这些事件。 <book> <title>TCP/IP</title> <author> Stevens</author> <publisher>Addison</publisher> <price>65.95</price> </book> SAX解析器 事件处理程序 XML 文件 startElement (book) startElement (title) characters (TCP/IP) . . . . . . . 解析文件 产生事件

SAX主要事件 startDocument事件 startElement事件 Characters事件 endElement事件 attribute a; a.getLength(); a.getQname(); a.getValue(); Characters事件 endElement事件 endDocument事件

SAX解析举例 <?xml version="1.0" encoding="GB2312"?> <bib> book title author year 1994 TCP/IP last first publisher price Addison 65.95 Stevens W. <?xml version="1.0" encoding="GB2312"?> <bib> <book year="1994"> <title>TCP/IP Illustrated</title> <author> <last>Stevens</last> <first>W.</first> </author> <publisher>Addison-Wesley</publisher> <price>65.95</price> </book> </bib>

大纲 OrientX4.0已完成的工作 XML文档的SAX解析 xml文档的Dewey编码 存储和索引 SLCA 算法的实现

OrientX4.0系统结构 Data manager Schema Manager Index Storage XML Documents Query Result Query/ Keywords Update XPath Data Definition Address Records XQuery Element Node Keyword-search Coder Execute Engine xml文档的编码 Storage Manager

Dewey编码 int dewey[51]={0,-1,-1,…,-1} 对元素、属性、属性值、文本进行编码 举例 bib book title author year 1994 TCP/IP last first publisher price Addison 65.95 Stevens W. 0.0 0.0.0 0.0.1 0.0.2 0.0.4 0.0.3 0.0.0.0 0.0.1.0 0.0.2.0 0.0.2.1 0.0.3.0 0.0.4.0 0.0.2.0.0 0.0.2.1.0

编码举例 初始情况:int dewey[51]={0,-1,-1,-1,…,-1} start: bib {1,0,………} start: book {2,0,0,……..} start: year {3,0,0,0,……} start:1994 {4,0,0,0,0,…….} end:1994 {3,0,0,0,0,-1,……} end: year {2,0,0,0,-1,-1} start: title {3,0,0,1,……} bib book title author year 1994 TCP/IP last first publisher price Addison 65.95 Stevens W. <?xml version="1.0" encoding="GB2312"?> <bib> <book year="1994"> <title>TCP/IP Illustrated</title> <author> <last>Stevens</last> <first>W.</first> </author> <publisher>Addison-Wesley</publisher> <price>65.95</price> </book> </bib> 0.0 0.0.0 0.0.1 0.0.0.0

大纲 OrientX4.0已完成的工作 XML文档的SAX解析 xml文档的Dewey编码 存储和索引 SLCA 算法的实现

OrientX4.0系统结构 Data manager Schema Manager Index Storage XML Documents Query Result Query/ Keywords Update XPath Data Definition Address Records XQuery Element Node Keyword-search Coder Execute Engine Dewey编码的存储 与索引 Storage Manager

编码的组织 目标:给出要查询的关键字迅速找到对应的Dewey编码 hash倒排表存储编码 几点要注意的问题 关键字的分割 无意义关键字

倒排表结构 图 hash inverted list

一个例子 key: Stevens; Deweycode: 0.0.2.0.0 hash(Stevens)=((S*31+t)*31+…)/Nhash=552 552 NULL Stevens 0.0.2.0.0 5

一个例子 key: Stevens; Deweycode: 0.1.2.0.0 hash(Stevens)=552 552 Stevens NULL Stevens 0.0.2.0.0 5 5 0.1.2.0.0 NULL

一个例子 key: xxx, 0.1.3.0 hash(xxx)=552 552 Stevens 5 5 0.0.2.0.0 0.1.2.0.0 NULL xxx 4 0.1.3.0 NULL NULL

一些问题 关键字的分割 意义不大的关键字 文本结点 属性值结点 选择合适的分隔符: 空格,逗号,冒号,…. 定冠词 连词 …… 可能含有多个关键字

大纲 OrientX4.0已完成的工作 XML文档的SAX解析 xml文档的Dewey编码 存储和索引 SLCA 算法的实现

OrientX4.0系统结构 Data manager Schema Manager Index Storage XML Documents Query Result Query/ Keywords Update XPath Data Definition Address Records XQuery Element Node Keyword-search Coder Execute Engine SLCA算法的实现 Storage Manager

SLCA的实现 Naïve 方法 对所有关键字的组合求LCA 从结果中去掉祖先结点 剩余的就是SLCA结点 Key S Stevens:0.0.2.0.0,0.1.2.0.0 Key A Addison-Wesley:0.0.3.0,0.1.3.0

Stack算法 Key S Stevens:0.0.2.0.0,0.1.2.0.0 Key A Addison-Wesley:0.0.3.0,0.1.3.0 S A T F 2 (a) node0.0.2.0.0 bib book author last first publisher …. Addison Stevens W. price 65.95 …… 0.0 0.1 0.0.2 0.0.3 0.0.2.0 0.0.3.0 0.1.3.0 0.0.2.0.0 0.1.2.0.0

Stack算法 Key S Stevens:0.0.2.0.0,0.1.2.0.0 Key A Addison-Wesley:0.0.3.0,0.1.3.0 S A S A T F 2 T F 2 2 T F T F (a) node0.0.2.0.0 F T 3 bib book author last first publisher …. Addison Stevens W. price 65.95 …… (b) node0.0.3.0 0.0 0.1 0.0.2 0.0.3 0.0.2.0 0.0.3.0 0.1.3.0 0.0.2.0.0 0.1.2.0.0

Stack算法 Key S Stevens:0.0.2.0.0,0.1.2.0.0 Key A Addison-Wesley:0.0.3.0,0.1.3.0 S A S A T F 2 T F 2 2 T F T F (a) node0.0.2.0.0 F T 3 T F F bib book author last first publisher …. Addison Stevens W. price 65.95 …… (b) node0.0.3.0 report 0.0 as a slca 0.0 0.1 T F 2 1 0.0.2 0.0.3 1 T F (c) node0.1.2.0.0 0.0.2.0 0.0.3.0 F T 3 1 0.1.3.0 1 T F 0.0.2.0.0 0.1.2.0.0 (d) node0.1.3.0 report 0.1 as a slca

Thanks!