中文元数据标准研究及其示范数据库 项目进展及其成果应用 肖珑 北京大学图书馆 2004年11月,南京
主要内容 项目进展情况 描述元数据规范及其《设计指南》 开放实验及应用 结语
1. 项目发展情况 历史回顾(一): 2000年6月,北京,第一次中文资源共建共享会议立项 名称:中文元数据标准研究及其示范数据库 负责单位:北京大学数字图书馆研究所 北京大学图书馆 CALIS管理中心 北京大学信息科学技术学院
1. 项目发展情况 历史回顾(二): 2002年9月,澳门,项目进展汇报 中文元数据标准框架 元数据规范: 古籍 拓片 舆图 学位论文 电子图书 网络资源
1. 项目发展情况 历史回顾(三): 2002年12月,国家科技部重大基础课题-“我国数字图书馆标准规范建设” 包含10个子项目,三个与元数据相关 “专门数字对象元数据标准规范”子项目由北京大学图书馆负责 与本项目合作,共同发展
1. 项目发展情况 项目目标 针对具有中国特色和在我国广泛应用的数字对象,分别建立相应的数字规范,包括格式定义、语义定义、开放标记规范、内容编码体系、扩展规则,建立各种专门元数据与基本元数据的标准转换关系和转换模板,建立各种专门元数据与其它专门元数据的标准转换关系和转换模板,编制各个专门元数据的应用指南,选择推荐专门元数据编制模块,建立基于专门元数据的一个应用协议编制指南,建立专门元数据定义信息、应用协议和转换工具的等级机制。
1. 项目发展情况 建设任务 跟踪分析国内外元数据标准规范的发展与应用趋势,提出关于专门数字对象元数据的性质、特点、描述体系、应用体系的分析报告。 选择合适的专门数字对象类型,建立相应的专门数字对象元数据格式及其编码体系、使用指南、使用范例、编制模块等。 建立专门数字对象元数据的扩展规范和应用协议编制规范,建立各个专门数字对象元数据与基本元数据和其它专门元数据的标准转换关系和转换模板,提供基于专门元数据进行交换和互操作的基础。 建立专门数字对象元数据的开放描述、应用管理和公共登记规则,并在数字图书馆标准规范开放建设框架内建立专门数字对象元数据开放建设机制。
1. 项目发展情况 参加研制单位 北京大学图书馆(组长单位) 上海图书馆(副组长单位) 国家图书馆 科学院文献情报中心 CALIS管理中心 清华大学图书馆 上海交通大学图书馆
1. 项目发展情况 已经完成的元数据规范 古文献:古籍,拓片,家谱,地方志,舆图; 论文:学位论文,会议论文,期刊论文; 图书:电子图书(教学参考书); 音频资料; 原生数字资源(born-digital):网络资源
1. 项目发展情况 其它完成的任务 国内外元数据现状与发展趋势调研 国内数字资源对象及其元数据标准发展状况分析 描述元数据规范设计指南 描述元数据核心元素集; 11种专门数字对象分析报告 11种专门数字对象元数据规范; 11种专门数字对象元数据的相关著录规则; 开放著录实验系统及11种元数据著录子系统; 中心实验网站; 一定数量的实验数据
1. 项目发展情况 参加开放实验单位 国家图书馆,上海图书馆 北京大学图书馆,清华大学图书馆,上海交通大学图书馆,北京师范大学图书馆,四川大学图书馆,中国人民大学图书馆,中国农业大学图书馆,中山大学图书馆,浙江大学图书馆,西安交通大学图书馆,复旦大学图书馆,上海音乐学院图书馆,上海外国语大学图书馆,上海大学图书馆,中央音乐学院图书馆,协和医科大学图书馆,南京大学图书馆 CALIS管理中心 中国科学院文献情报中心 ……
2. 描述元数据规范及其《设计指南》 《描述元数据规范设计指南》 为保证各种元数据规范在功能、数据结构、格式、语义语法等方面的一致性和整体性 同时也为在更大范围内实现与系统或数字图书馆之间的互操作和数据共享 用于指导各元数据规范的设计与应用。 古文献:古籍,拓片,家谱,地方志,舆图; 论文:学位论文,会议论文,期刊论文; 图书:电子图书(教学参考书); 音频资料;
2. 描述元数据规范及其《设计指南》 《设计指南》主要内容 描述元数据的定义及功能 描述元数据规范的设计原则 描述元数据的基本结构、元素组成与扩展规则 描述体系与定义方法 元数据规范应用的相关规则 设计流程与工作规范 文档规范
2. 描述元数据规范及其《设计指南》 定义及其功能: 描述元数据:即用于描述或标识数字对象内容的元数据。 功能 描述 定位 管理 检索 评估和选择 交互
2. 描述元数据规范及其《设计指南》 设计原则 需求分析 对象分析 简单性与准确性原则 专指度与通用性原则 互操作性与易转换性原则 可扩展性原则 用户需求原则
2. 描述元数据规范及其《设计指南》 基本结构 核心元素:在各类资源对象中通用。核心元素复用DC的15个基本元素。拟在该层上与其它系统进行交换,支持通用的检索工具。 资源类型核心元素:根据资源对象特点、参照其它元数据标准制定,在同一类型数字资源中通用。不同的资源类型可有不同的资源类型核心元素设置及其语义定义,应用时要求遵守本资源类型的相关规则和定义。 个别元素:以某种特定的资源对象为基础制定,仅适用于这类对象,不用于交换。应用时仅要求该种对象遵守其定义。
2. 描述元数据规范及其《设计指南》 核心元素集复用DC的原则(一): 采用“简单DC”(simple DC),不推荐使用“限制性DC”(qualified DC)。 严格遵守其元素语义定义。核心元素集中元素的语义不允许有交叉。 核心元素并非必备元素,允许只复用其中一部分。 5,金石年代(时间),导师(contributor)
2. 描述元数据规范及其《设计指南》 核心元素集复用DC的原则(二): 允许复用“限制性DC”中的修饰词(qualifier),必须说明并严格遵守其语义定义。 允许在复用时根据资源情况重新命名元素和修饰词。 与DC的映射: 映射单位可以是元素,也可以是修饰词; 可以建立一对多(如一个元素与DC的多个元素)、多对一(多个元素与DC的一个元素)的映射关系。 5,金石年代(时间),导师(contributor)
2. 描述元数据规范及其《设计指南》 资源类型核心元素举例: 个别元素举例: 古文献系列核心元素: 学位论文 版本 载体形态 收藏历史 馆藏信息 个别元素举例: 学位论文 学位
2. 描述元数据规范及其《设计指南》 扩展规则 横向扩展规则(元素层次) 纵向扩展规则(修饰词层次) 部分元素取值规则 核心元素、资源类型核心元素、个别元素 纵向扩展规则(修饰词层次) 修饰词:元素修饰词、编码体系修饰词 尽可能采用Dump-down原则 其它元数据规范修饰词的应用 部分元素取值规则 Type元素:参见“信息资源名称规范列表” Format元素:参见“数字资源加工标准与操作指南” 子项目成果
2. 描述元数据规范及其《设计指南》 借鉴ISO/IEC 11179标准,按以下12个方面定义元素和元素修饰词: 名称(Name): 统一资源标识符(URI): 标签(Label): 版本(Version): 注册机构(Registration Authority): 语言(Language): 定义(Definition): 术语类型(Type of Term): 数据类型(Datatype): 频次范围(Occurence):. 修饰(Qualifies): 注释(Comment):
2. 描述元数据规范及其《设计指南》 著录规则:为开放实验编写 规范档 检索说明 1) 引言 2) 总则 3) 各元素/修饰词的著录细则 1) 引言 2) 总则 3) 各元素/修饰词的著录细则 4) 参考文献 规范档 检索说明
2. 描述元数据规范及其《设计指南》 设计流程与工作规范 资源分析 初步设计 征求意见 手工著录实验 再次征求意见 完成元数据规范(初稿) 建立实验系统及中心实验网站 相关著录规则 开放实验 第三次征求意见 形成元数据规范(修订稿) 公开应用 形成元数据规范(推荐稿)
2. 描述元数据规范及其《设计指南》 文档规范 文字规范 资源分析报告 资源类型核心元素集 元数据规范 著录系统及其子系统需求 著录规则 著录实验报告 … …
2. 描述元数据规范及其《设计指南》 描述元数据规范举例: 古籍 舆图 家谱 地方志 学位论文 音频资料 会议论文 古文献:古籍,拓片,家谱,地方志,舆图; 论文:学位论文,会议论文,期刊论文; 图书:电子图书(教学参考书); 音频资料;
3. 开放实验及应用 开放实验 中心实验系统 中心实验网站 著录规则 数据质量控制规则 20多个参加单位 60,000条实验数据 http://162.105.139.81:8080/metac/ 著录规则 数据质量控制规则 20多个参加单位 60,000条实验数据
3. 开放实验及应用 开放实验系统-功能 支持以WEB方式的网上元数据著录方式; 不同的专门数字对象描述元数据规范的定义与维护; 支持多个元数据标准规范的著录规范; 依据核心集转换规则实现元数据集的互转; 支持著录实验数据以XML的导入与导出; 支持著录实验数据以简单文本格式的导入与导出; 支持元数据著录对象的显示; 支持简单的实验数据检索要求、全文检索、统一检索 用户管理与统计功能; 数据管理功能(支持临时库、主库及数据审核功能); 系统日常维护功能; 系统帮助功能。
3. 开放实验及应用 开放实验系统-功能模块 元数据著录模块 元数据检索模块 数据管理模块 用户管理及统计模块 系统管理模块 帮助模块
3. 开放实验及应用 应用项目 CALIS高校学位论文数据库 CALIS重点学科专题数据库 CALIS重点学科导航数据库 CADAL中美百万册书项目 中国科学文献服务系统(Science China) 北京大学数字图书馆古文献资源库(祕籍琳琅) 其它……
4. 结语 下一步发展 扩大开放实验 修改元数据规范 完成元数据规范推荐稿 专门数字对象元数据规范的开放应用机制 推广应用 增加更多的数字对象,扩大项目
谢谢!
参考文献 http://162.105.139.81:8080/metac/ http://cdls.nstl.gov.cn/cdls2/w3c/ http://rbdl.calis.edu.cn/index.htm 我国数字图书馆标准规范建设之“基本数字对象描述元数据”子项目组. 基本数字对象描述元数据标准,2004年5月