Download presentation
Presentation is loading. Please wait.
1
数字图书馆标准规范建设与应用 北京交通大学图书馆 张 彦 2008年4月
2
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范
数字图书馆信息服务与管理的标准规范
3
1.开放环境下的数字图书馆 1.1 我们所面临的环境 用户角度:以用户为中心的信息环境 信息环境:多元、关联、交互的数字信息过程
信息服务:基于馆藏、基于集成、基于用户
4
1.开放环境下的数字图书馆 1.2 我们所遇到的问题 处于分布、异构和动态变化的信息资源和服务环境中
必须能够被用户在复杂的网络环境下方便利用 能被第三方系统方便利用,能够方便利用第三方系统
5
1.开放环境下的数字图书馆 1.3 我们要做的:可使用性、互操作性、可持续性
可使用性:资源和服务能够在网络环境和复杂的技术条件下被用户方便的使用 互操作性:在网络环境上与其它系统进行信息交换功能、组合; 服务集成;流程协同的能力 可持续性:在变化的环境下长期使用的能力
6
1.开放环境下的数字图书馆 遵循开放标准规范是数字图书馆建设的基本原则。 这不是技术选择的自由 而是对用户和历史的责任
7
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范
数字图书馆信息服务与管理的标准规范
8
2.数字图书馆标准规范建设框架 实施指南 建设规范 加工规范 标识规范 基本元数据 专门元数据 检索规范 资源集合元数据 高层元数据
规范预研 元数据等级系统 发展战略 建设机制 核心标准规范体系 开放发展机制
9
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范
数字图书馆信息服务与管理的标准规范
10
3.数字图书馆内容创建的标准规范 3.1数字内容加工过程的标准规范 3.2内容编码标准规范 3.3格式标准规范
前加工过程、加工的内容标准、加工过程规范、后加工过程 3.2内容编码标准规范 内容编码、格式组织、内容标识、复合对象格式 3.3格式标准规范 格式体系,文本,图像,视频,音频等 3.4数字对象标识规范 唯一标示符命名体系,优先采用URI或者Info命名域 图书期刊论文集:推荐标准---最低标准 报纸海报年画剪纸:推荐标准---最低标准 古籍(善本家谱方志):推荐标准---最低标准 手稿乐谱草图:推荐标准 照相缩微胶片:推荐标准 音频资料:推荐标准---保存、应用 视频资料:最低标准---保存
11
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范
数字图书馆信息服务与管理的标准规范
12
4.数字图书馆对象描述的标准规范 4.1 基本元数据标准 4.2 基本元数据扩展标准、基本元数据应用规范 4.3 专门元数据
13
4.1 基本元数据标准 元数据的基本概念 元数据:对信息资源进行结构化描述的数据,用来规定数字化信息的组织和描述规则的一种数据结构标准。
元数据的内涵:由语义、内容标准和句法三部分构成。
14
4.1 基本元数据标准 元素定义说明 定义:对元素概念与内涵说明 数据类型:元数据值所表现的数据类型 频次范围:元素识用频次范围[0,∞)
注释:关于元素或者应用的其他说明
15
基本元数据核心集(15个元素) 名称(Title) 格式(Format) 创建者(Creator) 标示符(Identifier)
主题(Subject) 来源(Source) 描述(Description) 语种(Language) 出版者(Publisher) 关联(Relation) 其他责任者(Contributor) 时空范围(Coverage) 日期(Date) 权限(Rights) 类型(Type) 名称:名称 标签:title 统一资源定位符: 定义:资源名称及说明文字 必备性:由则必备 可重复性:可重复 术语类型:元素 元素修饰词:交替名称
16
4.2 基本元数据扩展标准 4.2.1 术语概念 4.2.2 扩展集元素定义规则 4.2.3 扩展集的组成结构* 4.2.4 扩展集元素定义
17
4.2.1 术语概念 修饰词: 元素修饰词: 对元素细化或者限定时期更具有专职性和精确性 编码体系修饰词:
修饰词是元素修饰词和编码体系修饰词的统称。 修饰词和元素一样识资源的一个属性 元素修饰词: 对元素细化或者限定时期更具有专职性和精确性 编码体系修饰词: 用来帮助解析某个术语值的上下文信息或解析规则。 形式包括受控词表、规范标示或解析规则。 编码体系修饰词包括两类:词表编码体系修饰词 句法编码体系修饰词
18
4.2.2 扩展集元素定义规则 定义:对修饰词概念与内涵的说明 数据类型:元素值中所表现的数据类型 频次范围:术语使用的频次范围
注释:修饰词的应用注释 修饰:指出该术语所修饰的元素 术语类型:元素修饰词还是编码体系修饰词
19
4.2.3 扩展集的组成结构 元素修饰词和编码体系修饰词列表 核心元素集 元素修饰词 编码体系修饰词 名称 交替名称 创建者 主题 描述
LCSH国会图书馆主题词表 CT汉语主题词表 UDC国际十进分类法 DDC杜威十进分类法 LASC中科院图书馆图书分类法 FDC四部分类法 描述 目次 、摘要 日期 创建日期、生效日期、发行日期、修改日期、提交日期 Perord:对于时间间隔的限定规范 W3CDTF:基于ISO8601的规范的时间和日期的编码规则 EY:年号纪年、古代纪年法等 类型 DCMTYPE:区分资源内容性质或种类的类型词表 格式 范围、媒体 因特网资源媒体类型
20
4.2.4 扩展集元素定义 基本元数据标准定一了15个核心元数据30个扩展元数据
在所定义的修饰词不能满足专门领域活具体应用的识继续趋势,可以服用其他方案的修饰词,也可以根据应用规范补充和修饰元素
21
4.2 基本元数据扩展规则 横向元素扩展:尽可能复用本领域相关元数据 纵向限定扩展:遵循(dumb-down)向上兼容原则
从横向纵向两个方向扩展形成专门元数据规范
22
Marc到基本元数据的映射 1.CNMARC到基本元数据的映射 CNMARC字段 字字段 元素名称 修饰词 元素修饰词 编码体系修饰词
010 $a 标示符 ISBN 101 语种 ISO639-2 200 名称 $d 交替名称 $e $f 创建者 $g 其它责任者 215 $a,$c,$d 描述 225 关联
23
2.基本元数据到marc映射 元素名称 元素修饰词 编码体系 出现位置 MARC21 CNMARC 名称 无 第一 24500$a
其它 24633$a 5171#$a 交替名称 任何 创建者 1001#$a 1102#$a 1112#$a 701#0$a 71102$a 71112$a 7001#$a 7102#$a 7112#$a 720##$a 702#0$a
24
4.3专门元数据 4.3.1专门元数据基本结构 4.3.2专门元数据元素组成 4.3.3专门元数据扩展规则
25
4.3 专门元数据 基本元数据和专门元数据的关系 拓片 论文元数据 古籍元数据 基本元数据 电子图书元数据 拓片元数据
26
4.3 专门元数据 4.3.1基本结构 核心元素: 在各类资源对象中通用,核心元素复用DC的15个基本元素,在该层上与其它系统进行交换,支持通用的检索工具。 资源类型核心元素: 根据资源对象特点,参照其他元数据标准制定,在同一类型数字资源中通用。不同的资源类型可有不同的资源类型核心元素设置及其予以定义,应用时要求遵守本资源类型的相关规则和定义。 个别元素: 以某种特定的资源对象为基础制定,尽是用于这类对象,不用于交换。
27
4.3专门元数据 4.3.2专门元数据元素组成---核心元素集 名称(Title) 格式(Format) 创建者(Creator)
标示符(Identifier) 主题(Subject) 来源(Source) 描述(Description) 语种(Language) 出版者(Publisher) 关联(Relation) 其他责任者(Contributor) 时空范围(Coverage) 日期(Date) 权限(Rights) 类型(Type)
28
4.3专门元数据 4.3.2专门元数据元素组成—资源类型核心元素 古文献系列核心元素 版本类别载体形态 馆藏信息
视音频系列:版本、受众、背景、源载体 DC-LIB应用纲要中的三个要素:edition\location\audience
29
4.3专门元数据 元素组成---个别元素 学位论文 学位 元素组成—修饰词 元素修饰词 编码体系修饰词 元数据医院数据规范结构举例
30
4.3专门元数据的扩展规则 横向扩展:元素层面 应遵守核心元素,资源类型核心元素,个别元素的结构组成
各元数据标准尽可能采用核心元素集推荐的元数据项,并在语义上保持一致 对推荐的元素不能描述特征的可以增加元素,但与已有元素不能有任何语义上的重复
31
4.3专门元数据 纵向扩展原则 为了更准确的描述对象,可以使用修饰词的方式向下扩展一层
尽可能使用DCMI制定的修饰词,以及各个应用方案中的修饰词,例如dc-education,dc-lib. 尽可能遵守dumb-dowm向上兼容原则
32
4.3专门元数据 参考资料: 期刊、会议、学位论文元数据规范及著录规则
肖珑.中文元数据概论与实例.北京图书馆出版社.2007 期刊论文元数据规范 期刊论文元数据著录规则 会议论文元数据规范 会议论文元数据著录规则 学位论文元数据规范 学位论文著录规则
33
专门元数据参考资料 张晓林.元数据研究与应用.北京:北京图书馆出版社,2002
中国高等教育文献保障系统管理中心.中国高等教育数字图书馆技术标准与规范,2004 曾蕾,张甲,张晓林.元数据标准的演变.中国图书馆学报,2003(4),p10-14 中国高等教育数字图书馆 肖珑,陈凌.中文元数据标准扩昂价一其应用.大学图书馆学报,2001,19(5) ,p29-35
34
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范
数字图书馆信息服务与管理的标准规范
35
5.数字图书馆信息服务与管理的标准规范 依赖元数据收集的仓储/聚合型 --- OAI-PMH元数据获取协议
依赖计算机处理能力和标准协议的元搜索 ----Z39.50协议
36
依赖元数据收集的仓储/聚合型 通过抽取、映射等手段从多个分布的异构资源提供者的仓储中(Repository)收割(Harvest)元数据,将之集中保存在本地系统,并在此基础上提供统一的检索和增值服务。 数据提供者只要遵循OAI协议的相应要求,提供OAI接口,把自己的元数据暴露出来,服务提供者就可按照OAI协议采集元数据,对外提供相应的服务。
37
依赖计算机处理能力和标准协议的元搜索 元搜索就是用户只递交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。而这种元搜索所采用的标准协议主要就是Z39协议。 Z39.50协议是分布式虚拟联合数据库检索体系,其目的是实现网上多个数据库检索,规范查询格式,简化检索过程,实现异构系统和不同图书馆系统之间的通信.根据这一标准建立的检索系统可以检索多种不同类型的信息,如文本、图像和多媒体资源等。实现不同数据库系统之间通信,使异构数据库系统及异构网络相互传递信息,目前Z39已经成为一种通用的数据库接口规范。目前国内外的检索系统,尤其是图书馆自动化系统陆续支持Z39.50检索协议,馆际间OPAC系统资源整合主要运用Z39标准。OCLC、CSA、OVID、EBSCO、GALE等国外大型数据库都支持Z39检索协议。
38
参考内容 我国数字化图书馆标准语规范建设网站 http://cdls.nstl.gov.cn 《数字图书馆标准规范发展趋势》
《我国数字图书馆标准规范建设与应用实施指南》 其它数字图书馆标准规范研究报告 其它数字图书馆标准规范
39
更多内容详见
40
版权所有 请勿转载 谢 谢 版权所有 请勿转载
Similar presentations