Presentation is loading. Please wait.

Presentation is loading. Please wait.

基于元数据仓储的资源发现系统调研、分析与思考

Similar presentations


Presentation on theme: "基于元数据仓储的资源发现系统调研、分析与思考"— Presentation transcript:

1 基于元数据仓储的资源发现系统调研、分析与思考
清华大学资源发现测试小组 窦天芳

2 2009 OCLC Online Catalogs:What Users and Librarians Want
问 题 的 提 出 2009 OCLC Online Catalogs:What Users and Librarians Want “方便胜于质量”&“检索体验和得到所需同等重要” “最终用户依赖并期望提升包括文摘目次在内的内容品质” “高级检索和分面帮助用户应对大量的检索结果集” …… 用户在检索体验,数据质量,检索结果的重新组织方面的期待

3 目前图书馆应用的系统 问 题 的 提 出 传统的书目管理系统 以书目信息管理为主&分面&FRBR 统一的电子资源管理系统
检索体验&有限结果集的处理

4 主流的发现系统 SUMMON PRIMO WorldCat Local EBSCO HOST EDS 开源软件

5 Summon/ Primo/Google scholar 工作机制 从出版商,大学,公开的网站收集的学术文献信息; 集中索引;
调研的主要产品 Summon/ Primo/Google scholar 工作机制 从出版商,大学,公开的网站收集的学术文献信息; 集中索引; “quick easy simple search”--summon “for quick, easy, and effective searching and retrieval”---Primo

6 Summon/Primo/Google Scholar
服务架构 saas saas+本地数据和界面 云计算支撑的saas cloud-based service 用户界面 Primo 第三方系统 LOCAL index Primo Central 集中索引3 集中索引1 集中索引2

7 Summon/Primo/Google Scholar
服务架构 saas saas+本地数据和界面 云计算支撑的saas cloud-based service 用户界面 Central index 集中索引1 集中索引3 集中索引2

8 Summon/Primo/Google Scholar

9 Summon/Primo/Google Scholar--数 据 量
 486,325,421 487,364,976 放检索词为空, Add results beyond your library's collection,exclude newspaper 134,714,335 133,674,780

10 Summon/Primo/Google Scholar—数据量
Primo Central(2亿) 不接受检索词为空 集中索引使用策略 Summon/Google Scholar 不加限制 Primo 限制,提交申请表来开放检索的授权

11 Summon/Primo/Google Scholar—数据量
特例 以作者为 “Andrew C.C. Yao”OR“Andrew C. Yao”OR“Andrew Chi-Chih Yao”OR“Yao, Andrew C.”OR“Yao, Andrew C.-C.”检索 作者的文章列表数:114 产品 SUMMON GOOGLE SCHOAR Primo 返回结果 29 1104(119) 47 匹配结果 24(学位论文) 69 40(ACM)

12 Summon/Primo/Google Scholar—数据质量
数据处理 summon Primo central Journal Article On the Complexity of Maintaining Partial Sums Author: Yao, Andrew C Publication Title SIAM Journal on Computing Date 1985 Volume 14 Issue 2 Start Page 277 ISSN DOI / Language English 题名: Simulating an agile, synchronized manufacturing system. 作者: Carlson, John G.H ; Yao, Andrew C 主题: Retail trade ; Furniture industry & trade ; Textile fabrics ; Production management 馆藏: International Journal of Production Economics, Apr2008, Vol. 112 Issue 2, p714 同行评审期刊 描述: Abstract: Retail customers are demanding more variety, more features and quicker order response times from manufacturers. Furniture production systems have had to... 识别标签: ISSN: ; DOI: /j.ijpe 来源: Business Source (EBSCO) 语言: 英语

13 Summon/Primo/Google Scholar—数据质量
产品 SUMMON GOOGLE SCHOAR Primo 返回结果 29 1104(119) 47 匹配结果 24(学位论文) 69 40(ACM) 数据质量 规范格式 参差不齐(摘要)

14 Summon/Primo/Google Scholar—检索体验
考察: 速度 专业检索的便利性

15 Summon/Primo/Google Scholar—检索体验

16 Summon/Primo/Google Scholar—检索体验
API creator:("Yao Andrew C") OR creator:("Andrew C.C. Yao") OR creator:("Andrew C. Yao") OR creator:("Andrew Chi-Chih Yao") OR creator:("Yao Andrew C.-C.") 47

17 Summon/Primo/Google Scholar——检索体验
产品 SUMMON GOOGLE SCHOAR Primo central 返回结果 29 1104(119) 47 匹配结果 24(学位论文) 69 40(ACM) 数据质量 规范 参差不齐 OR组合检索 有待提高 支持2个 预期提高 检索速度 好 <1s 好 <1s

18 Summon/Primo/Google Scholar—检索体验
“simple easy quick ” 产品 SUMMON GOOGLE SCHOAR Primo 简单检索

19 Summon/Primo/Google Scholar—检索体验

20 Summon/Primo/Google Scholar—检索体验
产品 SUMMON GOOGLE SCHOAR Primo central 返回结果 29 1104(119) 47 匹配结果 24(学位论文) 69 40(ACM) 数据质量 规范 参差不齐 OR组合检索 有待提高 支持2个 预期提高 检索速度 好 <1s 好 <1s 单一检索框 √simple easy quick 高级检索 最灵活,友好,一点点可视化 不灵活 单个作者 预期改善

21 Summon/Primo/Google Scholar—检索结果处理
分面 &FRBR&去重&排序&全文传递&数据服务

22 Summon/Primo/Google Scholar—检索结果处理
产品 SUMMON GOOGLE SCHOAR Primo 分面 灵活,同分面检索Limit to articles from scholarly publications, including peer-review 少量 灵活/peer review 去重 策略 correct 可控制的去重 FRBR 未发现 较好处理 排序 时间,相关度 相关度(引用次数) 时间,相关度,作者,标题,popular 全文传递 开放链接系统360 link 开放获取 开放链接系统SFX 结果输出 print 文献管理 alert 数据服务 数据节点 API WIKI

23 Summon/Primo/Google Scholar—检索结果处理

24 Summon/Primo/Google Scholar—检索结果页面
What do you mean? 输入提醒

25 基于元数据仓储的资源发现系统——思考 资源覆盖度是一个过程 检索的灵活性? 结果处理,未来的数据服务? 用户行为在系统中的体现?
与Google scholar的关系? 在检索结果管理和全文获取方面,商用平台和科研环境及图书馆的业务结合更紧密。 基于元数据仓储的资源发现系统有很大的发展空间,在未来依托数据提供特色服务提供了 广阔的空间。

26 Summon/Primo/Google Scholar—本地数据整合
与本地数据整合 学位论文&OPAC&多媒体数据

27 Summon/Primo/Google Scholar—本地数据整合

28 Primo系统中 学位论文数据字段映射 学位论文系统 PRIMO/search PRIMO/display dc:title
TITLE_CN title dc:subject   KEYWORD_CN subject dc:key   dc:class   SUBJECT_NAME dc:creator   AUTHOR creatorcontrib creator dc:coverage   PAGENUM coverage Coverage/format dc:description   ABSTRACT_CN description dcterms:abstract ABSTRACT_EN dc:publisher   AU_INSTITUTION publisher dc:date   LATEST_DATE <creationdate> dc:add   AU_ dc:rights   RIGHTS_SECRET rights dc:location   AU_DEPT dcterms:isPartOf   DEGREE_TYPE Description/subject ispartof dc:rightsholder   PUBLICATION_PLACE dc:identifier   RES_ID Recorded/ identifier   dcterms:created   SUBMIT_DATE creatdate dc:url   FULLTEXT_URL linktorsrc

29 Primo系统中 学位论文数据字段映射

30 基于资源发现系统的深度应用——清华的探索
科研文献支撑环境中的作用 作者 &合作者&期刊&会议追踪&可视化

31 基于资源发现系统的深度应用——清华的探索
作者 &合作者&期刊&会议追踪&可视化

32 基于资源发现系统的深度应用——清华的探索
<sear:DOC SEARCH_ENGINE="Local Search Engine" NO="3" RANK=" " ID=" "> <PrimoNMBib xmlns=" <record> <control> <sourcerecordid> </sourcerecordid> <sourceid>gale_ofa</sourceid> <recordid>gale_ofa </recordid> <sourceformat>XML</sourceformat> <sourcesystem>Other</sourcesystem> </control> <display> <type>article</type> <title>A note on universal composable zero-knowledge in the common reference string model.(Report)</title> <creator>Yao, Andrew C.C. ; Yao, Frances F. ; Zhao, Yunlei</creator> <ispartof>Theoretical Computer Science, March 6, 2009, Vol.410(11), p.1099(10)</ispartof> <identifier><b>ISSN: </b> </identifier> <subject>Computer science -- Analysis</subject> <description><AuthorAbstract> <P> To link to full-text access for this article, visit this link: </P> <P> Byline: Andrew C.C. Yao (a), Frances F. Yao (b), Yunlei Zhao (c) </P> <P> Abstract: </P> <P> Pass observed that universal composable </description> <language>eng</language> <source>OneFile (GALE)</source> <lds50>peer_reviewed</lds50> </display> <links>

33 基于资源发现系统的深度应用——清华的探索
<citation><p>Goodwin. (1987). A parameter estimation perspective of continuous time model reference adaptive control???,<i>Proceedings of the Institution of Mechanical Engineers Part A Journal of Power and Energy</i>,23(31), 57 <a href="

34 基于资源发现系统的深度应用——清华的探索
解 析 作 者 检索条件 XML文件 合 作 者 外部数据 期 刊 链 接/最新文章 call for paper 会 议 会议归档

35 基于资源发现系统的深度应用——清华的探索

36 基于元数据仓储的资源发现系统调研、分析与思考
谢谢各位!


Download ppt "基于元数据仓储的资源发现系统调研、分析与思考"

Similar presentations


Ads by Google