数字资源的数字化ID ——唯一标识符
一、什么是数字资源的 唯一标识符
数据资源在共享过程中面临着异构数据存储、异域数据存储、数据格式转换 等问题,使得信息资源的互相访问遭遇技术障碍。 唯一标识符系统 我国公共图书馆存储着大量的文本、图像、多媒体等多种形式的数字资源,但是这些数据往往是在不同时期、由不同的公司利用不同的工具在不同的平台上研发出来,并且运行在不同的操作系统和不同的数据库平台之上。 数据资源在共享过程中面临着异构数据存储、异域数据存储、数据格式转换 等问题,使得信息资源的互相访问遭遇技术障碍。
唯一标识符系统 公共图书馆通过建立数字标识和数字对象的关系,使用统一的规则标识资源,使用统一的解析机制实现标识符与具体信息之间的对应,可以对这些数字资源进行高效的管理,实现数字资源的准确、快速定位,使用户以最短的时间,最少的操作获得最想要的资源服务。
一、什么是数字资源的唯一标识符 数字资源的唯一标识符是按统一的规则和程序授予数字资源的唯一和永久的名字,形象的被称为数字资源的条形码。
唯一标识符系统 一、系统建设背景 唯一标识符的特点 可以赋予任意种类、任意格式的对象 可以针对任意注册元数据类型 配置颗粒度或者特征 资源种类 不限 可以针对任意注册元数据类型 配置颗粒度或者特征 颗粒度 可配 可兼容、包含其它编码方案 如ISBN, ISSN 兼容性 强 一旦分配,永远不变 永久唯一
二、唯一标识符的作用
二、数字资源唯一标识符的作用 数字资源的唯一标识符是实现应用系统互操作的关键技术之一,通过对每个数字资源进行唯一标识,可以使数字资源的标识独立于物理位置、应用系统和存取协议,有效链接每个数字资源。 对数字资源唯一标识 将采集、加工、组织、检索、服务以及保存等各环节中的数字资源进行统一编号和规范管理 全国图书馆数字资源的精确定位和应用系统之间的互操作
集中检索,分布式访问 二、数字资源唯一标识符的作用 统一用户管理系统 用户 文津搜索系统 唯一标识符系统 读者门户系统 处理检索数据 登录 认证 用户 文津搜索系统 唯一标识符系统 读者门户系统 传递CDOI 给唯一标识符系统 检索“红楼梦” 跳转读者门户 发送检索请求 处理检索数据 提取CDOI字段 解析CDOI 定位资源的URL 跳转资源页面 集中检索,分布式访问
二、数字资源唯一标识符的作用 发布与服务系统
二、数字资源唯一标识符的作用 OPAC系统
三、国内外唯一标识符技术 研究现状
三、国内外唯一标识符体系研究现状 国外研究情况(Handle 系统)
三、国内外唯一标识符体系研究现状 目前,国际主流的唯一标识符系统都是使用Handle系统或以Handle系统作为原型进行开发。 美国国会图书馆在“美国记忆”的数字图书馆项目中,采用Handle来标识数字对象,在全球Handle注册中心独立申请了国会图书馆的一级命名授权“loc”,二级命名授权采用收藏部门的代码。
三、国内外唯一标识符体系研究现状 日本的内容标识符论坛以Handle系统为底层支撑技术独立开展唯一标识符的研发和服务,通过嵌入式内容标识符与数字水印技术来保护知识产权和数字内容权益。 国立台湾大学也采用Handle系统作为底层框架建设唯一标识符系统,用于标识数字对象。
三、国内外唯一标识符体系研究现状 2. 国外研究情况(DOI系统) DOI系统是在Handle系统基础上开发的商业软件,在出版领域已经成功应用,它通过注册代理来分配和注册唯一标识符。1997年在法兰克福图书博览会上首次亮相以来,目前在国外唯一标识符领域已经得到广泛认可,并形成了一套行之有效的管理机制。
三、国内外唯一标识符体系研究现状 DOI系统注册代理机构(10个): 1.华艺数字(台湾) 2.CNKI(中国知网) 3.CrossRef(美国) 4.DataCite (德国) 5.Entertainment Identifier Registry EIDR (美国) 6.mEDRA (欧洲) 7.OPOCE (Office des publications EU) (欧盟) 8.R.R. Bowker(美国) 9.中国科技信息研究所-中文DOI 10.Japan Link Center(日本)
三、国内外唯一标识符体系研究现状 西方 中国 Blackwell John Wiley 西方很多出版商加入了DOI 成立中文DOI注册中心 中国科学技术信息研究所和北京万方数据股份有限公司于2007年联合向IDF申请取得了DOI 的中文注册权,成立了中文DOI 注册中心。 Blackwell John Wiley
三、国内外唯一标识符体系研究现状 3. 国内研究情况 国内大型的数字资源生产商(万方数据、清华同方、重庆维普等):在不同程度使用了唯一标识符,对期刊、论文等各种数字资源都进行了标识。 图书馆界:国家图书馆、CALIS、国家科技图书文献中心、上海数字图书馆、中国数字图书馆有限公司等机构都尝试在内部的数字对象管理中应用唯一标识符。 近几年,新闻出版总署、中国版权中心、科技部、教育部等都不同程度的开展关于数字对象唯一标识符方面的探索,在一定程度上推动了我国数字对象唯一标识符的发展。
国内现状总结 三、国内外唯一标识符体系研究现状 国内唯一标识符建设主要应用于各自内部特定的资源和环境,各自拥有自定义的唯一标识符规则,无论在规范和软件支持方面,都没有成熟的解析体系,还没有成型和成规模。 唯一标识符应用主要分布在各个机构内部,没有开展有效的合作,应用层次比较低。
不能照搬照抄DOI系统,需要进行自主研发。 三、国内外唯一标识符体系研究现状 DOI系统在图书馆界的运用还存在困难: 标识的目的:DOI是基于新闻出版机构,基于数字资源内容的唯一标识,偏重资产管理及应用,一个DOI标识一册书或一篇文章,相同的内容是同一个DOI号;图书馆需要标识的是数字资源的对象,主要是用于系统服务能精确定位,同一册书或者一篇文章,可能来源于多个图书馆,或者在同一个图书馆存在多种格式的数字化版本,如资源发布采用PDF格式,长期保存采用TIFF格式等,需要多个标识符号为不同的应用进行分别标识和命名。 从技术角度来说,按照HANDLE系统的架构,需要提交数据到注册中心,存在潜在的信息安全隐患;不能掌握核心技术,必将永远受制于IDF (国际DOI 基金会);还有每年的巨额服务费用。 国家数字图书馆的唯一标识符系统 不能照搬照抄DOI系统,需要进行自主研发。
四、国家数字图书馆 唯一标识符命名规则
前缀 后缀 四、国家数字图书馆唯一标识符命名规则 1. 唯一标识符结构 国家数字图书馆唯一标识符命名规则采用“前缀/后缀”的方式,前缀和后缀各段采用英文半角“.”分隔。 前缀 后缀 “108.ndlc.2.1100009031010001/T1F23.0196011586” “108.ndlc.2.1100009031010001/T1F23.0196011586”
四、国家数字图书馆唯一标识符命名规则 108.ndlc.2.1100009031010001 前缀 第一段 第二段 第三段 第四段
前缀 108.ndlc.2.1100009031010001 国家区域代码:108 四、国家数字图书馆唯一标识符命名规则 第一段 第二段 第三段 第四段 国家区域代码:108
前缀 108.ndlc.2.1100009031010001 国家数字图书馆代码 四、国家数字图书馆唯一标识符命名规则 第一段 第二段 第三段 第四段 ndlc 国家数字图书馆代码
前缀 108.ndlc.2.1100009031010001 服务节点代码 四、国家数字图书馆唯一标识符命名规则 第一段 第二段 第三段 第四段 从1开始按顺序进行编码 服务节点代码
前缀 108.ndlc.2.1100009031010001 四、国家数字图书馆唯一标识符命名规则 第一段 第二段 第三段 第四段 采用16位编码命名,分为三个部分 注册机构代码: 110000 903101 0001 第一部分 第二部分 第三部分
四、国家数字图书馆唯一标识符命名规则 前缀:第四段——第一部分 “108.ndlc.2.1100009031010001/T1F23.0196011586” “108.ndlc.2.1100009031010001/T1F23.0196011586” 位数 前6位 属性 区域码 参照标准 中华人民共和国行政区域代码(GB/T 2260-1999) 代码表示 表示该机构的行政级别 范例 以福建省为例: 福建省区域码为350000 福州市区域码为350100 厦门市区域码为350200
四、国家数字图书馆唯一标识符命名规则 前缀:第四段——第二部分 “108.ndlc.2.1100009031010001/T1F23.0196011586” “108.ndlc.2.1100009031010001/T1F23.0196011586” 位数 7-12位 属性 行业码 代码表示 所属行业及其行业属性 前4位 代表所属行业 后2位 代表行业属性 采用标准 《国民经济行业分类》国家标准 (GB/T 4754-2011),如图书馆为9031 采用两位数字表示,如图书馆属性可分为: 01 公共图书馆;02 高校图书馆;03 专业图书馆; 范例 国家图书馆行业码:903101 北京大学图书馆:903102 中国医学科学院图书馆:903103
四、国家数字图书馆唯一标识符命名规则 前缀:第四段——第三部分 “108.ndlc.2.1100009031010001/T1F23.0196011586” “108.ndlc.2.1100009031010001/T1F23.0196011586” 位数 最后4位 属性 机构序号 代码表示 为所属行政区域范围内所属行业的机构代号, 编码范围为:0001-9999 编码分配策略 从0001开始,采取先申请先授权先分配编码的策略 范例 以福建省图书馆、福州市图书馆、厦门市图书馆来举例说明: 福建省图书馆注册机构代码为:3500009031010001 “350000”为福建省区域码;“903101”为行业码;“0001”为机 构序号。 福州市图书馆注册机构代码为:3501009031010001 “350100”为福州市区域码 厦门市图书馆注册机构代码为:3502009031010001 “350200”为厦门市区域码
四、国家数字图书馆唯一标识符命名规则 后缀 T1F23.0196011586 后缀 第一段 综合信息编号 第二段 系统内部唯一号
TnFnOn TnFnOn T为:type的简写,表示资源种类 F为:format简写,表示文件格式 四、国家数字图书馆唯一标识符命名规则 后缀 —— 第一段 “108.ndlc.2.1100009031010001/T1F23.0196011586” “108.ndlc.2.1100009031010001/T1F23.0196011586” 综合信息包括三部分:分别描述资源种类、文件格式和来源系统,采用字母和数字的组合方式表示。 TnFnOn TnFnOn 例如: T为:type的简写,表示资源种类 F为:format简写,表示文件格式 O为:other简写,表示来源于其他系统 n为:自然数
四、国家数字图书馆唯一标识符命名规则 资源种类 资源种类 资源编号 图书 T1 期刊 T2 论文 T3 报纸 T4 图片 T5 音频 T6 视频 T7 网页采集 T8 … …
四、国家数字图书馆唯一标识符命名规则 文件格式 文件格式 格式编号 ARC F1 ICO F11 MPEG4 F21 TXT F31 ARJ ISO F12 PCD F22 WAV F32 ASP F3 JPG F13 PDF F23 XLS F33 AVI F4 LZH F14 PIC F24 F34 BMP F5 LZW F15 PNG F25 XML F35 CAB F6 MDB F16 PPT F26 YUV F36 DBF F7 MID F17 PSD F27 ZIP F37 DOC F8 MOV F18 RAR F28 …… FLV F9 Mp3 F19 TAR F29 GIF F10 MPEG2 F20 TIF F30
四、国家数字图书馆唯一标识符命名规则 后缀 —— 第一段 文件格式: 举例说明: 图书类型的PDF格式资源描述为:T1F23; 图书类型的资源,既有PDF格式文件,也有TXT格式文件: 如果以PDF格式为主,描述为T1F23; 如果以TXT格式为主,描述为T1F31; 图片类型的JPG格式资源描述为:T5F13; 视频类型的FLV格式资源描述为:T7F9。
四、国家数字图书馆唯一标识符命名规则 来源系统 如果来源系统与其他系统已提交的注册数据的系统号重复,采用“On”形式描述,按照O1、O2、O3…的顺序,先注册先分配,否则将“On”省略。
四、国家数字图书馆唯一标识符命名规则 来源系统 举例说明: 文献数字化系统已成功注册一条唯一标识符为: “108.ndlc.2.1100009031010001/T1F23.0196011586” Aleph系统的系统号 0196011586 如果网页采集系统提交一条注册数据: 由于该系统未通过Aleph系统编目,则采用本系统的系统号 如果系统号也为0196011586,生成唯一标识符: “108.ndlc.2.1100009031010001/T1F23O1.0196011586”
四、国家数字图书馆唯一标识符命名规则 后缀 —— 第二段 系统内部唯一号: 系统内部唯一号采用系统号和颗粒度描述规则共同表示,该字段由若干子段组成,各子段采用英文半角“.”分隔。 “108.ndlc.2.1100009031010001/T1F23.0196011586” “108.ndlc.2.1100009031010001/T1F23.0196011586”
四、国家数字图书馆唯一标识符命名规则 后缀 —— 第二段 系统内部唯一号: 系统内部唯一号采用系统号和颗粒度描述规则共同表示,该字段由若干子段组成,各子段采用英文半角“.”分隔。 如果注册数据经过Aleph等编目系统编目,系统号使用Aleph系统的系统号,否则使用本系统的系统号。 系统号 颗粒度 描述规则 参照文献数字化加工的命名规范。
四、国家数字图书馆唯一标识符命名规则 2. 注册数据准备 (1)系统管理员分配的注册数据 参见 注册机构代码:
四、国家数字图书馆唯一标识符命名规则 (2)用户提交的注册数据 系统号 系统内部标识对象的标识号。如果注册数据经过Aleph等编目系统编目,则使用Aleph系统的系统号;否则使用本系统内部唯一号。 MARC记录标识号 MARC记录001字段。 题名 资源名称。
四、国家数字图书馆唯一标识符命名规则 创建者 创建资源内容的主要责任者,可以为个人,组织或某项服务。 ISBN 国际标准书号 ISSN 国际标准连续出版物编号
四、国家数字图书馆唯一标识符命名规则 语种 出版者 使资源成为可以获得并可用的责任者,包括个体,组织,或服务。 出版时间
四、国家数字图书馆唯一标识符命名规则 资源种类编号表: 标识对象类型 资源种类 资源编号 T1 期刊 T2 论文 T3 报纸 T4 图片 T5 音频 T6 视频 T7 网页采集 T8 … … 标识对象类型的说明,如图书、期刊、论文、图片等,各资源类型编号参见右表:
四、国家数字图书馆唯一标识符命名规则 标识对象格式 资源的物理或数字表现形式,如PDF、TIFF、JPG等,各种文件格式编号。详见下表: ARC F1 ICO F11 MPEG4 F21 TXT F31 ARJ F2 ISO F12 PCD F22 WAV F32 ASP F3 JPG F13 PDF F23 XLS F33 AVI F4 LZH F14 PIC F24 F34 BMP F5 LZW F15 PNG F25 XML F35 CAB F6 MDB F16 PPT F26 YUV F36 DBF F7 MID F17 PSD F27 ZIP F37 DOC F8 MOV F18 RAR F28 …… FLV F9 Mp3 F19 TAR F29 GIF F10 MPEG2 F20 TIF F30
四、国家数字图书馆唯一标识符命名规则 URL 描述信息 数据来源 关联 当前资源部分或全部源自该元素所标识的资源 描述资源间的关联关系 资源内容的说明。描述可以包括但不限于以下内容:文摘、目录、对以图形来揭示内容的资源而言的文字说明、或者一个有关资源内容的自由文本描述。 数据来源 当前资源部分或全部源自该元素所标识的资源 关联 描述资源间的关联关系
四、国家数字图书馆唯一标识符命名规则 对象颗粒度 资源类型 颗粒度1(K1) 颗粒度2(K2) 颗粒度3(K3) 图书T1 种、册 页 插图、公式 期刊T2 种、期 论文T3 种 报纸T4 版面 文章、图片 图片T5 种、幅 音频T6 种、首 某一段 视频T7 种、场 网页采集T8 种、页
四、国家数字图书馆唯一标识符命名规则 举例说明: 标识粒度为“T1K1V1” 标识粒度为“T2K2V1” 对象颗粒度 资源类型 颗粒度1(K1) 图书T1 种、册 资源类型 颗粒度2(K2) 期刊T2 页 表示该图书类资源按“种”形式注册唯一标识符 表示该期刊类资源按“页”形式注册唯一标识符。
四、国家数字图书馆唯一标识符命名规则 T1图书 K1粒度: 单卷册:不需要描述。 粒度范围 T1图书 K1粒度: 单卷册:不需要描述。 多卷册:第N卷(册)使用“mN”描述;如果是以第N卷(册)起始的多卷(册)使用“mNaX”来描述,X值按注册顺序依次排列。 其中,m为multiple简写,a为additional简写,N,X为自然数,X按顺序先注册先分配。
四、国家数字图书馆唯一标识符命名规则 T1图书 K1粒度: 举例说明: 粒度范围 T1图书 K1粒度: 举例说明: 某一套丛书系统号为0196011586,该丛书分为10册且10册为同一系统号。则: 全套10册粒度范围为:0196011586; 第5册粒度范围为:0196011586m5; 第5,6,7册粒度范围为:0196011586m5a1; 第5,6册粒度范围为:0196011586m5a2。
四、国家数字图书馆唯一标识符命名规则 T1图书 K2粒度: 参照文献数字化加工命名规则 粒度范围 文件命名规则 粒度范围 前封(含封一、封二) Axxxxx_00.pdf An 目录页之前的前附页 Bxxxxx_00.pdf Bn 目录页之后的前附页 Dxxxxx_00.pdf Dn 目录页 Cxxxxx_00.pdf Cn 正文 Txxxxx_00.pdf Tn 后附页 Yxxxxx_00.pdf Yn 后封 Zxxxxx_00.pdf Zn 注:xxxxx为5位数字,按原书顺序依次排序;n=1,2,3…。
四、国家数字图书馆唯一标识符命名规则 T1图书 K2粒度: 举例说明: 正文第1页描述为:T1; 目录第2页描述为:C2; 粒度范围 T1图书 K2粒度: 举例说明: 正文第1页描述为:T1; 目录第2页描述为:C2; 正文前24页描述为:T1a1(a表示追加); 正文第1页以及第5,6,7页描述为:T1a2。
四、国家数字图书馆唯一标识符命名规则 粒度范围 T1图书 K3粒度: 采用自然数N描述插图或公式编号,按顺序进行分配。
四、国家数字图书馆唯一标识符命名规则 T1图书——唯一标识符命名规则举例 举例1 :某一套丛书系统号为0196011586, 这套丛书共有10册且10册共用同一系统号。 全部10册唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011586 第5册唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011586m5 第5,7,8,9册唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011586m5a1
四、国家数字图书馆唯一标识符命名规则 T1图书——唯一标识符命名规则举例 举例1 :某一套丛书系统号为0196011586, 这套丛书共有10册且10册共用同一系统号。 第5,6,7册唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011586m5a2 第5册正文第1页唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011586m5.t1 第5册正文前24页唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011586m5.t1a1
四、国家数字图书馆唯一标识符命名规则 T1图书——唯一标识符命名规则举例 举例1 :某一套丛书系统号为0196011586, 这套丛书共有10册且10册共用同一系统号。 第5册正文前10页唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011586m5.t1a2 第5册正文第10页的第一幅插图唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011586m5.t10.1 按插图注册唯一标识符,如第5册正文第10页的第1,2幅插图唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011586m5.t10.1a1
四、国家数字图书馆唯一标识符命名规则 T1图书——唯一标识符命名规则举例 举例2:某一种书系统号为0196011589,且该种书为单册。 该册图书唯一标识符: 108.ndlc.2.1100009031010001/T1F23.0196011589 按页注册唯一标识符,参照例1中第5-7条。 按插图/公式注册唯一标识符,参照例1中第8-9条。
四、国家数字图书馆唯一标识符命名规则 T2期刊 K1粒度: 描述期刊的出版年、期刊期号等信息。 出版年用 y 描述,为 year 简写; 粒度范围 T2期刊 K1粒度: 描述期刊的出版年、期刊期号等信息。 出版年用 y 描述,为 year 简写; 期刊期号用 i 描述,为 issue 简写; 增刊用 s 描述,为 supplement 简写; 合订本用 b 描述,为 bound 简写。
四、国家数字图书馆唯一标识符命名规则 T2期刊 K1粒度: 举例说明: 某期刊的系统号为010000015 粒度范围 T2期刊 K1粒度: 举例说明: 某期刊的系统号为010000015 该期刊2008年所有期粒度范围为:010000015.y2008; 该期刊2008年第6期粒度范围为:010000015.y2008i6; 该期刊2008年增刊粒度范围为:010000015.y2008sN, N为自然数,按顺序进行分配; 该期刊2008年合订本粒度范围为: 010000015.y2008b。
四、国家数字图书馆唯一标识符命名规则 粒度范围 T2期刊 K2粒度: 参照T1图书类型 K3粒度: 参照T1图书类型
四、国家数字图书馆唯一标识符命名规则 T2期刊——唯一标识符命名规则举例 举例:某期刊的系统号为010000015 该期刊所有期唯一标识符:108.ndlc.2.1100009031010001/T2F23.010000015 该期刊2008年所有期唯一标识符:108.ndlc.2.1100009031010001/T2F23.010000015.y2008 该期刊2008年,2009年所有期唯一标识符:108.ndlc.2.1100009031010001/T2F23.010000015.y2008a1 该期刊2008-2010年所有期唯一标识符:108.ndlc.2.1100009031010001/T2F23.010000015.y2008a2
四、国家数字图书馆唯一标识符命名规则 T2期刊——唯一标识符命名规则举例 举例:某期刊的系统号为010000015 该期刊2008年合订本唯一标识符:108.ndlc.2.1100009031010001/T2F23.010000015.y2008b 该期刊2008年第6期唯一标识符:108.ndlc.2.1100009031010001/T2F23.010000015.y2008i6 该期刊2008年第6,7,8期唯一标识符:108.ndlc.2.1100009031010001/T2F23.010000015.y2008i6a1
四、国家数字图书馆唯一标识符命名规则 T2期刊——唯一标识符命名规则举例 举例:某期刊的系统号为010000015 该期刊2008年第6,7期唯一标识符:108.ndlc.2.1100009031010001/T2F23.010000015.y2008i6a2 该期刊2008年增刊唯一标识符:108.ndlc.2.1100009031010001/T2F23.010000015.y2008s1 按页注册唯一标识符,参照例1中第5-7条。 按插图/公式注册唯一标识符,参照例1中第8-9条。
四、国家数字图书馆唯一标识符命名规则 T5图片 K1粒度: 描述单幅或多幅图片 粒度范围 T5图片 K1粒度: 描述单幅或多幅图片 如果该种有多幅图存在,采用“mN”形式,m代表多图,为“multiple”简写,N为自然数,按顺序进行分配。
四、国家数字图书馆唯一标识符命名规则 T5图片——唯一标识符命名规则举例 举例:某种图片的系统号为019025685 如果该种只有1幅图片,其唯一标识符为: 108.ndlc.2.1100009031010001/T5F13.019025685 如果该种有多幅图片,第2幅唯一标识符为: 108.ndlc.2.1100009031010001/T5F13.019025685m2 如果该种有多幅图片,第2,3幅唯一标识符为: 108.ndlc.2.1100009031010001/T5F13.019025685m2a1
四、国家数字图书馆唯一标识符命名规则 粒度范围 T6音频 K1粒度: 描述单曲或多曲信息 K2粒度: 描述一首曲子的某一段音乐
四、国家数字图书馆唯一标识符命名规则 T6音频——唯一标识符命名规则举例 举例:某种音频的系统号为019025686 如果该种只有1首曲子,其唯一标识符为: 108.ndlc.2.1100009031010001/T6F19.019025686; 如果该种有多首曲子,第2首曲子唯一标识符为: 108.ndlc.2.1100009031010001/T6F19.019025686m2; 如果该种有多首曲子,第2,3,4首曲子唯一标识符为: 108.ndlc.2.1100009031010001/T6F19.019025686m2a1;
四、国家数字图书馆唯一标识符命名规则 T6音频——唯一标识符命名规则举例 举例:某种音频的系统号为019025686 如果该种有多首曲子,第2个曲子的某一段,如从00:15:25这个时间 点开始,其唯一标识符为: 108.ndlc.2.1100009031010001/T6F19.019025686m2.001525; 如果这首曲子另一段音乐也是从00:15:25这个时间点开始,其唯一 标识符为: 108.ndlc.2.1100009031010001/T6F19.019025686m2.001525a1;
四、国家数字图书馆唯一标识符命名规则 必备字段:系统号、URL(本字段在唯一标识符生成时可以为空)、题名。 有则必备字段:作者、MARC记录标识号、创建者、ISBN、ISSN、语种、出版者、出版时间、标识对象类型、标识对象格式、标识粒度、粒度范围、连续出版物卷期号、描述信息、来源、关联。
五、国家数字图书馆 唯一标识符系统
五、国家数字图书馆唯一标识符系统 2002年以来技术跟踪 2008年启动标准规范研究 2010年底启动推广工程 2011年初开始系统建设 一直跟踪唯一标识符领域的研究进展 2008年1月中科院文献情报中心中标,开始进行唯一标识符标准的研制; 2010年9月提交唯一标识符标准规范和应用指南等成果; 2010年10月出版《国家图书馆数字资源唯一标识符规范和应用指南》; 2011年11月立项行业标准《数字对象唯一标识符规范》,已报文化部并通过审查,正在与国家标准委员会沟通。 2008 2010年底启动推广工程 2010年底,策划启动“国家数字图书 馆推广工程”; 2012年9月,文化部在张家港召开推 广工程工作会议,会议决定唯一标识 符系统作为必配系统要求推广到省、 市图书馆。 2010 2011年初开始系统建设 2011年初国家图书馆启动了国家数字图书馆 唯一标识符系统项目,在推广工程的带动下, 拟构建公共图书馆数字资源唯一标识符体系, 将分散在全国各省、市图书馆的海量数字资 源进行统一标识,使它们组织成为一个有机 整体。 2011
五、国家数字图书馆唯一标识符系统 系统功能 系统配置 唯一标识符生成 系统监控 数字资源唯一标识符系统 URL维护 用户管理 唯一标识符维护 唯一标识符解析 注册数据维护 系统配置 用户管理 统计管理 系统监控 日志管理 唯一标识符维护 数据库备份与还原 系统管理 URL维护 数据库导出
机构操作员开始元数据注册与唯一标识符业务处理 五、国家数字图书馆唯一标识符系统 1. 机构注册 注册机构 填写机构注册信息 接收邮件并进行激活处理 节点管理员注册机构审核 吉林省图书馆节点-吉林省图书馆管理元数据、等业务需要注册一个机构 其它图书馆注册机构 机构管理员用户管理、权限管理等 机构操作员开始元数据注册与唯一标识符业务处理
五、国家数字图书馆唯一标识符系统 2. 用户管理 唯 一 标 识 符 系 统 用 户 互联网用户 前台用户 机构用户 机构管理员 机构操作员 2. 用户管理 互联网用户 唯 一 标 识 符 系 统 用 户 前台用户 机构用户 机构管理员 机构操作员 节点管理员 后台用户 节点操作员 前台用户,指通过前台实现唯一标识符解析与唯一标识符注册管理的用户 机构用户,指图书馆组织机构用户,该用户需要注册登录,登录后,可进行机构操作员添加管理与元数据注册维护、唯一标识符正、反向解析等操作。 互联网用户,无须登录注册,只能通过前台进行唯一标识符解析操作。 后台用户,指针对部署节点系统,对节点系统进行管理维护的用户
五、国家数字图书馆唯一标识符系统 3. 数据注册 唯一标识符数据注册方式 单条手工注册 批量自动注册 系统接口
/ 五、国家数字图书馆唯一标识符系统 注册数据 注册成功 单条输入 批量导入 系统接口 后缀分配规则 唯一标识符生成子系统 前缀 后缀 生成规则 唯一标识符 返回注册结果 失败 成功 注册成功
五、国家数字图书馆唯一标识符系统 首先 然后 最后 填写或上传唯一标识符注册数据,经格式校验和数据查重后,系统获取资源种类、资源类型、资源颗粒度等资源信息和系统内部唯一号生成唯一标识符后缀 用户登录系统,系统根据用户信息获得注册机构代码,生成唯一标识符前缀 系统根据唯一标识符生成规则,由前缀和后缀组合生成唯一标识符。
五、国家数字图书馆唯一标识符系统 注册数据模板
五、国家数字图书馆唯一标识符系统 4. 唯一标识符解析 唯一标识符解析 正向解析 反向解析
五、国家数字图书馆唯一标识符系统 正向解析 输入标识符 解析标识符 直接解析 返回解析结果 唯一标识符系统A 唯一标识符系统B 首先对前缀进行分析,如属于本服务节点注册的唯一标识符,则直接解析;否则向相应的服务节点提交解析请求并获取解析结果。如果所请求的服务节点在规定时间内无响应,则再向顶层服务节点发出解析请求并获得解析结果。 正向解析 输入标识符 【跨服务节点解析】 解析标识符 解析标识符 解析标识符 直接解析 返回解析结果 返回解析结果 返回解析结果
以输入数据为查询条件反向获取唯一标识符, 五、国家数字图书馆唯一标识符系统 反向解析 以输入数据为查询条件反向获取唯一标识符, 并返回查询结果。
五、国家数字图书馆唯一标识符系统 5. 对象数据URL地址管理 对象数据URL管理 手工维护 接口维护
五、国家数字图书馆唯一标识符系统 URL维护模板:
六、国家数字图书馆 唯一标识符体系
六、国家数字图书馆唯一标识符体系 唯一标识符 体系架构 …… 唯一标识符系统系统按照国家、省和市三层结构进行设计,将实现全国公共图书馆所有数字资源唯一标识符的注册和解析。 唯一标识符 体系架构 中心服务器 国家图书馆 首都图书馆 天津图书馆 南京图书馆 山东图书馆 …… 东城区图书馆 西城区图书馆 海淀区图书馆 扬州市图书馆 苏州市图书馆 常州市图书馆 …… ……
六、国家数字图书馆唯一标识符体系 …… …… …… …… 最上层为顶层服务,由国家数字图书馆代为管理,对各分支服务机构进行命名授权和管理。 采用星型结构同步国家数字图书馆和各子层图书馆的系统配置信息 通过分层模式逐层同步各省、市唯一标识符信息,保存各子层提交的注册数据 中心服务器 …… 国家图书馆 首都图书馆 天津图书馆 南京图书馆 山东图书馆 …… 东城区图书馆 西城区图书馆 海淀区图书馆 扬州市图书馆 苏州市图书馆 常州市图书馆 …… ……
省级图书馆作为注册服务节点,必须部署服务器 六、国家数字图书馆唯一标识符体系 省级图书馆作为注册服务节点 中心服务器 …… 国家图书馆 首都图书馆 天津图书馆 南京图书馆 山东图书馆 省级图书馆作为注册服务节点,必须部署服务器 …… 东城区图书馆 西城区图书馆 海淀区图书馆 扬州市图书馆 苏州市图书馆 常州市图书馆 …… ……
六、国家数字图书馆唯一标识符体系 …… …… …… …… 市级图书馆根据实际情况决定是否部署服务器, 如果部署服务器,为注册服务节点 如果不部署服务器,则为注册机构 中心服务器 …… 国家图书馆 首都图书馆 天津图书馆 南京图书馆 山东图书馆 市级图书馆 …… 东城区图书馆 西城区图书馆 海淀区图书馆 扬州市图书馆 苏州市图书馆 常州市图书馆 …… ……
六、国家数字图书馆唯一标识符体系 注册服务节点 注册服务节点管理着本命名授权下所有唯一标识符的注册和解析服务,保存本命名授权下所有成功注册唯一标识符的注册数据,并向上提交。 注册机构需要向相应的注册服务节点申请,填写注册机构信息,经系统合法性校验成功后,注册机构的机构管理员收到激活邮件,激活成功后等待注册服务节点系统管理员审批,待审核通过以后,机构管理员可以分配操作账号,进行唯一标识符的注册。 注册机构
六、国家数字图书馆唯一标识符体系 节点系统配置管理 机构注册管理 业务数据管理 节点编号配置 节点配置数据同步 节点配置数据修改 机构注册申请 机构注册审核 机构管理员添加 机构操作员添加 元数据注册 元数据维护 唯一标识符解析
已 开 展 六、国家数字图书馆唯一标识符体系 已开展工作 系统 已 开 展 搭建:唯一标识符系 统国家数字图书馆中 心节点、国家图书馆 节点、贵州馆节点、 山东馆节点、吉林馆 节点; 实现:省级服务节点 与国家数字图书馆中 心节点注册数据的同 步和互相解析。 数据注册 2013年国家图书馆 拟完成中文图书、 博士论文、民国文 献、数字方志、图 片、音视频等自建 数字资源唯一标识 符的注册。
谢谢!