数字图书馆标准规范建设与应用 北京交通大学图书馆 张 彦 2008年4月
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范 数字图书馆信息服务与管理的标准规范
1.开放环境下的数字图书馆 1.1 我们所面临的环境 用户角度:以用户为中心的信息环境 信息环境:多元、关联、交互的数字信息过程 信息服务:基于馆藏、基于集成、基于用户
1.开放环境下的数字图书馆 1.2 我们所遇到的问题 处于分布、异构和动态变化的信息资源和服务环境中 必须能够被用户在复杂的网络环境下方便利用 能被第三方系统方便利用,能够方便利用第三方系统
1.开放环境下的数字图书馆 1.3 我们要做的:可使用性、互操作性、可持续性 可使用性:资源和服务能够在网络环境和复杂的技术条件下被用户方便的使用 互操作性:在网络环境上与其它系统进行信息交换功能、组合; 服务集成;流程协同的能力 可持续性:在变化的环境下长期使用的能力
1.开放环境下的数字图书馆 遵循开放标准规范是数字图书馆建设的基本原则。 这不是技术选择的自由 而是对用户和历史的责任
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范 数字图书馆信息服务与管理的标准规范
2.数字图书馆标准规范建设框架 实施指南 建设规范 加工规范 标识规范 基本元数据 专门元数据 检索规范 资源集合元数据 高层元数据 规范预研 元数据等级系统 发展战略 建设机制 核心标准规范体系 开放发展机制
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范 数字图书馆信息服务与管理的标准规范
3.数字图书馆内容创建的标准规范 3.1数字内容加工过程的标准规范 3.2内容编码标准规范 3.3格式标准规范 前加工过程、加工的内容标准、加工过程规范、后加工过程 3.2内容编码标准规范 内容编码、格式组织、内容标识、复合对象格式 3.3格式标准规范 格式体系,文本,图像,视频,音频等 3.4数字对象标识规范 唯一标示符命名体系,优先采用URI或者Info命名域 图书期刊论文集:推荐标准---最低标准 报纸海报年画剪纸:推荐标准---最低标准 古籍(善本家谱方志):推荐标准---最低标准 手稿乐谱草图:推荐标准 照相缩微胶片:推荐标准 音频资料:推荐标准---保存、应用 视频资料:最低标准---保存
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范 数字图书馆信息服务与管理的标准规范
4.数字图书馆对象描述的标准规范 4.1 基本元数据标准 4.2 基本元数据扩展标准、基本元数据应用规范 4.3 专门元数据
4.1 基本元数据标准 元数据的基本概念 元数据:对信息资源进行结构化描述的数据,用来规定数字化信息的组织和描述规则的一种数据结构标准。 元数据的内涵:由语义、内容标准和句法三部分构成。
4.1 基本元数据标准 元素定义说明 定义:对元素概念与内涵说明 数据类型:元数据值所表现的数据类型 频次范围:元素识用频次范围[0,∞) 注释:关于元素或者应用的其他说明
基本元数据核心集(15个元素) 名称(Title) 格式(Format) 创建者(Creator) 标示符(Identifier) 主题(Subject) 来源(Source) 描述(Description) 语种(Language) 出版者(Publisher) 关联(Relation) 其他责任者(Contributor) 时空范围(Coverage) 日期(Date) 权限(Rights) 类型(Type) 名称:名称 标签:title 统一资源定位符:http://cdls.nstl.gov.cn/basic/terms/title 定义:资源名称及说明文字 必备性:由则必备 可重复性:可重复 术语类型:元素 元素修饰词:交替名称
4.2 基本元数据扩展标准 4.2.1 术语概念 4.2.2 扩展集元素定义规则 4.2.3 扩展集的组成结构* 4.2.4 扩展集元素定义
4.2.1 术语概念 修饰词: 元素修饰词: 对元素细化或者限定时期更具有专职性和精确性 编码体系修饰词: 修饰词是元素修饰词和编码体系修饰词的统称。 修饰词和元素一样识资源的一个属性 元素修饰词: 对元素细化或者限定时期更具有专职性和精确性 编码体系修饰词: 用来帮助解析某个术语值的上下文信息或解析规则。 形式包括受控词表、规范标示或解析规则。 编码体系修饰词包括两类:词表编码体系修饰词 句法编码体系修饰词
4.2.2 扩展集元素定义规则 定义:对修饰词概念与内涵的说明 数据类型:元素值中所表现的数据类型 频次范围:术语使用的频次范围 注释:修饰词的应用注释 修饰:指出该术语所修饰的元素 术语类型:元素修饰词还是编码体系修饰词
4.2.3 扩展集的组成结构 元素修饰词和编码体系修饰词列表 核心元素集 元素修饰词 编码体系修饰词 名称 交替名称 创建者 主题 描述 LCSH国会图书馆主题词表 CT汉语主题词表 UDC国际十进分类法 DDC杜威十进分类法 LASC中科院图书馆图书分类法 FDC四部分类法 描述 目次 、摘要 日期 创建日期、生效日期、发行日期、修改日期、提交日期 Perord:对于时间间隔的限定规范 W3CDTF:基于ISO8601的规范的时间和日期的编码规则 EY:年号纪年、古代纪年法等 类型 DCMTYPE:区分资源内容性质或种类的类型词表 格式 范围、媒体 因特网资源媒体类型
4.2.4 扩展集元素定义 基本元数据标准定一了15个核心元数据30个扩展元数据 在所定义的修饰词不能满足专门领域活具体应用的识继续趋势,可以服用其他方案的修饰词,也可以根据应用规范补充和修饰元素
4.2 基本元数据扩展规则 横向元素扩展:尽可能复用本领域相关元数据 纵向限定扩展:遵循(dumb-down)向上兼容原则 从横向纵向两个方向扩展形成专门元数据规范
Marc到基本元数据的映射 1.CNMARC到基本元数据的映射 CNMARC字段 字字段 元素名称 修饰词 元素修饰词 编码体系修饰词 010 $a 标示符 ISBN 101 语种 ISO639-2 200 名称 $d 交替名称 $e $f 创建者 $g 其它责任者 215 $a,$c,$d 描述 225 关联
2.基本元数据到marc映射 元素名称 元素修饰词 编码体系 出现位置 MARC21 CNMARC 名称 无 第一 24500$a 其它 24633$a 5171#$a 交替名称 任何 创建者 1001#$a 1102#$a 1112#$a 701#0$a 71102$a 71112$a 7001#$a 7102#$a 7112#$a 720##$a 702#0$a
4.3专门元数据 4.3.1专门元数据基本结构 4.3.2专门元数据元素组成 4.3.3专门元数据扩展规则
4.3 专门元数据 基本元数据和专门元数据的关系 拓片 论文元数据 古籍元数据 基本元数据 电子图书元数据 拓片元数据
4.3 专门元数据 4.3.1基本结构 核心元素: 在各类资源对象中通用,核心元素复用DC的15个基本元素,在该层上与其它系统进行交换,支持通用的检索工具。 资源类型核心元素: 根据资源对象特点,参照其他元数据标准制定,在同一类型数字资源中通用。不同的资源类型可有不同的资源类型核心元素设置及其予以定义,应用时要求遵守本资源类型的相关规则和定义。 个别元素: 以某种特定的资源对象为基础制定,尽是用于这类对象,不用于交换。
4.3专门元数据 4.3.2专门元数据元素组成---核心元素集 名称(Title) 格式(Format) 创建者(Creator) 标示符(Identifier) 主题(Subject) 来源(Source) 描述(Description) 语种(Language) 出版者(Publisher) 关联(Relation) 其他责任者(Contributor) 时空范围(Coverage) 日期(Date) 权限(Rights) 类型(Type)
4.3专门元数据 4.3.2专门元数据元素组成—资源类型核心元素 古文献系列核心元素 版本类别载体形态 馆藏信息 视音频系列:版本、受众、背景、源载体 DC-LIB应用纲要中的三个要素:edition\location\audience
4.3专门元数据 元素组成---个别元素 学位论文 学位 元素组成—修饰词 元素修饰词 编码体系修饰词 元数据医院数据规范结构举例
4.3专门元数据的扩展规则 横向扩展:元素层面 应遵守核心元素,资源类型核心元素,个别元素的结构组成 各元数据标准尽可能采用核心元素集推荐的元数据项,并在语义上保持一致 对推荐的元素不能描述特征的可以增加元素,但与已有元素不能有任何语义上的重复
4.3专门元数据 纵向扩展原则 为了更准确的描述对象,可以使用修饰词的方式向下扩展一层 尽可能使用DCMI制定的修饰词,以及各个应用方案中的修饰词,例如dc-education,dc-lib. 尽可能遵守dumb-dowm向上兼容原则
4.3专门元数据 参考资料: 期刊、会议、学位论文元数据规范及著录规则 肖珑.中文元数据概论与实例.北京图书馆出版社.2007 http://cdls.nstl.gov.cn/2003/SpcMetadata 期刊论文元数据规范 期刊论文元数据著录规则 会议论文元数据规范 会议论文元数据著录规则 学位论文元数据规范 学位论文著录规则
专门元数据参考资料 张晓林.元数据研究与应用.北京:北京图书馆出版社,2002 中国高等教育文献保障系统管理中心.中国高等教育数字图书馆技术标准与规范,2004 曾蕾,张甲,张晓林.元数据标准的演变.中国图书馆学报,2003(4),p10-14 中国高等教育数字图书馆 肖珑,陈凌.中文元数据标准扩昂价一其应用.大学图书馆学报,2001,19(5) ,p29-35 http://www.w3.org http://dublincore.org http://www.cadlis.edu.cn http://cdls.nstl.gov.cn/cdls2/w3c http://62.105.139.81:8080:metac
目录 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范 数字图书馆信息服务与管理的标准规范
5.数字图书馆信息服务与管理的标准规范 依赖元数据收集的仓储/聚合型 --- OAI-PMH元数据获取协议 依赖计算机处理能力和标准协议的元搜索 ----Z39.50协议
依赖元数据收集的仓储/聚合型 通过抽取、映射等手段从多个分布的异构资源提供者的仓储中(Repository)收割(Harvest)元数据,将之集中保存在本地系统,并在此基础上提供统一的检索和增值服务。 数据提供者只要遵循OAI协议的相应要求,提供OAI接口,把自己的元数据暴露出来,服务提供者就可按照OAI协议采集元数据,对外提供相应的服务。
依赖计算机处理能力和标准协议的元搜索 元搜索就是用户只递交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。而这种元搜索所采用的标准协议主要就是Z39协议。 Z39.50协议是分布式虚拟联合数据库检索体系,其目的是实现网上多个数据库检索,规范查询格式,简化检索过程,实现异构系统和不同图书馆系统之间的通信.根据这一标准建立的检索系统可以检索多种不同类型的信息,如文本、图像和多媒体资源等。实现不同数据库系统之间通信,使异构数据库系统及异构网络相互传递信息,目前Z39已经成为一种通用的数据库接口规范。目前国内外的检索系统,尤其是图书馆自动化系统陆续支持Z39.50检索协议,馆际间OPAC系统资源整合主要运用Z39标准。OCLC、CSA、OVID、EBSCO、GALE等国外大型数据库都支持Z39检索协议。
参考内容 我国数字化图书馆标准语规范建设网站 http://cdls.nstl.gov.cn 《数字图书馆标准规范发展趋势》 《我国数字图书馆标准规范建设与应用实施指南》 其它数字图书馆标准规范研究报告 其它数字图书馆标准规范
更多内容详见http://cdls.nstl.gov.cn
版权所有 请勿转载 谢 谢 版权所有 请勿转载