数字图书馆推广工程 软硬件平台建设 国家图书馆信息网络部 王乐春 2013年07月30日(南京)
目录 二 3 三 一 国家数字图书馆工程总体架构 国家数字图书馆工程建设成果 数字图书馆推广工程软硬件平台的建设
一、国家数字图书馆工程 总体架构
国外数字图书馆发展情况 美国国会图书 馆国家数字图书 馆项目始于1995 年。 美国国会图书 馆国家数字图书 馆项目始于1995 年。 2005年美国国 会图书馆计划与 世界各国图书馆 合作,组成一个 世界数字图书馆 的网上数据库, 该网站于2009年 4月正式投入使 用。 英国elib项目 始于1993年, 到2006年,该 项目已完成1200 万页的的数字化 资料、4000余万 条网上编目,并 且拥有400万名网 络读者。 1993年,法国 国家图书馆计划 进行资源的数字 化转化, 到2006年法国 国家图书馆的数 字化文本已达 11.7万册,其中 可在数据库上查 询的有9万册。 2000年,日本国 立国会图书馆制定 了“e-Japan”重 点计划 2004年,该项目 将工作侧重点放在 了扩充和强化网络 服务上,开展数字 化内容的建设和服 务。 2009年4月21日, 世界数字图书馆 网站在联合国教 科文组织总部所 在地巴黎正式启 用, 它为全球读者 免费提供网上浏 览服务, 使用者可利用7 种语言进行检索。
国内数字图书馆发展情况 经过二十多年的发展,我国政府、IT业、图书情报界在数字图书 馆理论研究、资源建设、标准体系、技术研发和数字图书馆服务 等方面有了较大的进展,取得了一定成果。
建设世界上最大的中文数字信息保存基地与服务基地为全国乃至全球提供数字信息服务 数图工程 目标 建设世界上最大的中文数字信息保存基地与服务基地为全国乃至全球提供数字信息服务 2010 经过2009年一年的建设和努力,2010年已进入数图工程的攻坚阶段。 2008 2008年9月9日,国家图书馆二期建成并正式开馆,部分数字图书馆创新服务建成投入使用,获得良好社会效益。 2005 2005年10月,国家数字图书馆工程的立项及建设论证阶段基本结束。 2003 2003年1月,项目可行性报告获批。 2001 2001年11月,国家图书馆二期工程暨国家数字图书馆工程项目正式立项。
数字资源生命周期 数图工程建设思路 国家数字图书馆 总体设计的四个重要方向 数字资源 发布服务 服务 资源 标准 技术 数字资源 组织 保存 数字资源 发布服务 数字资源 生产 数字资源生命周期
统一身份认证 标准规范体系 安全保障 体系 用户层 安全基础设施 技术规范 业务应用层 网络防病毒 数据规范 网关防篡改 应用支撑层 网络防黑客攻击 安全管理制度 用户层 统一身份认证 中央国家机关 科研生产单位 社会公众用户 图书馆用户 标准规范体系 技术规范 数据规范 实施规范 元检索服务 全文检索服务 电子阅览室服务 资源发布与服务 发布服务 业务应用层 文献传递与馆际互借 虚拟参考咨询 网上支付服务 个性化服务 基层资源服务 多媒体服务 虚拟现实服务 残疾人服务 资源采集 资源加工 资源组织与管理 文献数字化加工 数字资源加工管理 数字资源组织与存储 电子资源缴送 网络资源采集 全国联合编目 版权管理 中文信息处理 应用支撑层 内容管理 元数据服务 报表分析 数据表单处理 业务基础 支撑 消息服务 目录服务 流程服务 外部数据接口 数据抽取、过滤 数据交换 文献传递与馆际互借 数据基础 支撑 数据解析格式转换 XML、WebService 基层资源服务 数据层 元数据库 采购网络电子资源 本地文档 多媒体资源 自建特色资源 互联网 信息资源 电子图书资源 书目数据资源 …… 基础 设施
基础 设施
数据层 元数据库 采购网络电子资源 本地文档 多媒体资源 自建特色资源 互联网 信息资源 电子图书资源 书目数据资源 ……
应用支撑层 业务基础 支撑 数据基础 支撑 内容管理 元数据服务 报表分析 数据表单处理 消息服务 目录服务 流程服务 外部数据接口 数据抽取、过滤 数据交换 文献传递与馆际互借 数据基础 支撑 数据解析格式转换 XML、WebService 基层资源服务
业务应用层 发布服务 资源采集 资源加工 资源组织与管理 元检索服务 全文检索服务 电子阅览室服务 资源发布与服务 文献传递与馆际互借 虚拟参考咨询 网上支付服务 个性化服务 基层资源服务 多媒体服务 虚拟现实服务 残疾人服务 资源采集 资源加工 资源组织与管理 文献数字化加工 数字资源加工管理 数字资源组织与存储 电子资源缴送 网络资源采集 全国联合编目 版权管理 中文信息处理
用户层 统一身份认证 中央国家机关 科研生产单位 社会公众用户 图书馆用户
安全保障 体系 安全基础设施 网络防病毒 网关防篡改 网络防黑客攻击 安全管理制度
标准规范体系 技术规范 数据规范 实施规范
统一身份认证 标准规范体系 安全保障 体系 用户层 安全基础设施 技术规范 业务应用层 网络防病毒 数据规范 网关防篡改 应用支撑层 网络防黑客攻击 安全管理制度 用户层 统一身份认证 中央国家机关 科研生产单位 社会公众用户 图书馆用户 标准规范体系 技术规范 数据规范 实施规范 元检索服务 全文检索服务 电子阅览室服务 资源发布与服务 发布服务 业务应用层 文献传递与馆际互借 虚拟参考咨询 网上支付服务 个性化服务 基层资源服务 多媒体服务 虚拟现实服务 残疾人服务 资源采集 资源加工 资源组织与管理 文献数字化加工 数字资源加工管理 数字资源组织与存储 电子资源缴送 网络资源采集 全国联合编目 版权管理 中文信息处理 应用支撑层 内容管理 元数据服务 报表分析 数据表单处理 业务基础 支撑 消息服务 目录服务 流程服务 外部数据接口 数据抽取、过滤 数据交换 文献传递与馆际互借 数据基础 支撑 数据解析格式转换 XML、WebService 基层资源服务 数据层 元数据库 采购网络电子资源 本地文档 多媒体资源 自建特色资源 互联网 信息资源 电子图书资源 书目数据资源 …… 基础 设施
二、国家数字图书馆工程 建设成果
二、国家数字图书馆工程建设成果 1、软硬件平台建设方面 高速网络传输系统、海量数字资源存储系统、高性能服务器系统等硬件基础设施平台初步搭建完成,围绕海量数字资源生命周期管理的基础软件平台逐步建成。 硬件基础平台 高速网络 传输系统 海量数字资源 存储系统 高性能 服务器系统 基础软件平台
二、国家数字图书馆工程建设成果 1、软硬件平台建设方面 2、数字资源建设方面 国家数字图书馆工程建设了总量丰富、体系结构完备的数字资源 ,资源类型涵盖文本、图片、音频、视频、网络资源等,其中 78%以上资源已经通过互联网提供服务。 视频 电子文本 网络资源 音频 图片
二、国家数字图书馆工程建设成果 1、软硬件平台建设方面 2、数字资源建设方面 3、服务体系建设方面 服务范围覆盖互联网、移动通信网、广播电视网等,服务终 端涵盖计算机、数字电视、智能终端、触摸屏等几乎所有新 媒体终端,移动服务、数字电视服务、特殊人群服务等一系 列创新服务项目得到了读者的广泛好评。
二、国家数字图书馆工程建设成果 1、软硬件平台建设方面 2、数字资源建设方面 3、服务体系建设方面 4、标准规范建设方面 目前20余项数字资源采集、加工、组织、保存、管理、服务等方 面的标准规范已经研制完成,重点对中文信息处理中涉及的关键 技术与标准进行研发,国家数字图书馆标准规范体系基本形成。
经过几年的建设,国家数字图书馆已经成为 超大型的 图书馆数据中心 现代信息技术 与图书馆业务 高度融合的 技术支撑中心 全国图书馆互联互通 的网络中心 覆盖全民的 公共文化服务中心
三、数字图书馆推广工程 平台建设
三、数字图书馆推广工程平台的建设 (一)数字图书馆推广工程网络建设 1 、虚拟网主要承载的业务 服务类 数据 生产类 数据 沟通交流类 数据 数据类别 数据内容 国图及各地方馆的 自建资源以及外购资源 国图与省馆、市馆间的 应用系统业务数据交互 沟通交流类数据 如视频会议系统等 数据传输 特点 类型多样 (文本、图片、音视频) 实时性要求高 带宽占用一般 数据类型复杂 (文本、图片、音视频、书目数据、控制数据) 实时性要求一般 带宽占用大 数据类型较单一 (视频流等) 服务类 数据 生产类 数据 沟通交流类 数据
三、数字图书馆推广工程平台的建设 (一)数字图书馆推广工程网络建设 2 、虚拟网组网技术 数字图书馆数据在虚拟网上的隧道封装传输 数据节点A 数据节点B 互联网/政务外网/广电网 生产数据 服务数据 内部沟通数据 生产数据 服务数据 内部沟通数据 IPSec隧道封装 VPN 隧道 原始数据 文本 图片 文本 图片 视频 html 视频 html xml xml
三、数字图书馆推广工程平台的建设 (一)数字图书馆推广工程网络建设 3 、虚拟网全国组网架构 虚拟网的整体网络架构为:利用各节点自身互联网链路,通过IPSEC VPN技术组成虚拟网,实现各节点的互联互通。 IPSEC VPN IPSEC VPN 国图数字资源 互联网/政务外网/广电网 国家图书馆 省馆 地方馆到馆读者
三、数字图书馆推广工程软硬件平台的建设 (一)数字图书馆推广工程网络建设 4 、网络全国IP地址规划 数字图书馆虚拟网计划使用10.0.0.0/8地址段 每个省级馆分配1个B类IP地址 每个副省级馆分配2个C类地址 每个地市级馆由所在省馆规划若干个C类地址。 按照省馆行政排序进行IP地址分配,但有些图书馆已经使用了10.0.0.0/8的IP地址,本着冲突最小的原则,计划虚拟网业务IP地址使用10.100.0.0/16 - 10.254.0.0/16地址段 其中:10.100.0.0/16 - 10.134.0.0/16分配给各省级单位;10.135.0.0/16分配给各副省级市馆,每个副省级馆分配2个C的地址。10.136.0.0-10.255.255.255是备用地址。
虚拟网 截至2013年6月,国家图书馆已经实现与38家副省级以上图书馆、1家市级图书馆的虚拟网联通工作。 与国图联通 省内搭建 申请联通 38家副省以上馆 十堰市馆 16家 6家 虚拟网
能够为云计算、物联网等技术的应用提供网络环境 专网 能够承载大容量、高质量的数据传输 能够实现大型、分布式系统的互联互通, 能够为云计算、物联网等技术的应用提供网络环境 2013年 2014年 15家 18家 未来 最终形成以国家图书馆为核心, 联接省市县数字图书馆、乡镇综合文化站、村级文化活动室,服务覆盖全国的公共文化网络体系。 专 网
三、数字图书馆推广工程软硬件平台的建设 (二)数字图书馆推广工程软件平台建设 1 、软件系统介绍 依据数字资源生产、组织、保存及发布服务的生命周期构建了国家数字图书馆软件体系,软件体系中各个软件遵循模块化设计,通过标准接口实现数据通讯与高效协同。 核心业务 系统 软件分类 业务支撑 配套系统 Diagram 2 个性化服务 系统 Diagram 3 Diagram 2 Diagram 3
三、数字图书馆推广工程软硬件平台的建设 (二)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.1 、核心业务系统 —— 文献数字化加工系统 数字图书馆建设和服务的起点 数字图书馆文献数字化加工系统主要承担馆藏文 献资源的数字化生产加工任务,是数字图书馆数 字资源建设和服务的起点。
三、数字图书馆推广工程软硬件平台的建设 (二)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.1 、核心业务系统 —— 文献数字化加工系统 数字图书馆建设和服务的起点 系统利用拍照、扫描、采集、数字水印等技术手段将各类 传统文献资源转化为数字资源,并通过编辑、标引等操作 对数字资源进行深度加工,同时提供数字成品管理功能。 数字化加工管理中心 图书 生产线 期刊 报纸 古籍 缩微 音视频 ……
三、数字图书馆推广工程软硬件平台的建设 1.1 、核心业务系统 —— 文献数字化加工系统 实现数字化生产统一管理、合理调配 省中心 省中心 松耦合 关系 松耦合 关系 下达 数字化任务 统一管理生产 合理调配资源 市、县级图书馆
三、数字图书馆推广工程软硬件平台的建设 (二)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.1 、核心业务系统 —— 数字资源组织系统 组织是数字资源进行收集、整合的过程 数字资源组织系统将文献数字化、电子资源缴送、 网络资源采集等系统产生的各种数字资源进行收 集、验证及整合,生成元数据、对象数据,登记 相关管理数据,并完成元数据与对象数据的挂接。 系统提供数据导出或查询接口,并定期或者根据 请求向其他多种外部系统输出数据,实现数字资 源的集中调度和管理。
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.1 、核心业务系统 —— 数字资源组织系统 文献数字化产生数据 数字资源 保存系统 收集 传送数据 外购数据库 数字资源 发布与服务系统 数字资源组织系统 整合 文献检索 系统 其他系统数据库 (Aleph等)
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.1 、核心业务系统 —— 数字资源保存系统 保存是数字资源再利用的必要条件 系统制定与保存相关的流程和策略,将各类数字资源进行收集,建立完备的电子帐,并完成资源归档、数字资源迁移、资源使用等方面的管理,同时根据需要把数字资源分配到三层存储体系中去,实现对数字资源的长期保存和利用。系统还完成对其它应用系统和相关环境的监测,制定永久保存规则和数据移植策略等,以保证数字资源在其生命周期内的可靠性和完整性。
三、数字图书馆推广工程软硬件平台的建设 1.1 、核心业务系统 —— 数字资源保存系统
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.1 、核心业务系统 —— 文津搜索系统 传统搜索无法满足数字时代需求 伴随着我国数字图书馆的发展和国家数字图书 馆馆藏数字化资源的不断丰富,传统检索已不 能够很好地满足数字图书馆元数据、数字对象 揭示的需求。
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.1、核心业务系统 —— 文津搜索系统 发布与服务 系统数据 其他数据 组织系统 数据 图书馆界“谷歌”起航 元数据 统一检索揭示 互联网数据 用户 成员馆数据
三、数字图书馆推广工程软硬件平台的建设 1.1 、核心业务系统 —— 文津搜索系统 图书馆界“谷歌”起航 文津搜索系统为用户提供统一的检索入口,可以集中揭示国家数字图书馆及相关机构的数字资源,提供用户搜索使用过程中的知识关联、提取服务,最大限度地服务于不同的用户。文津搜索系统将建立中国图书馆界的元数据集中索引库,向用户提供一个实时高效、精准权威、拥有良好用户体验的数字资源搜索服务平台。
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.1 、核心业务系统 —— 资源发布与服务系统 数字时代读者如何获取资源 读者如何获取所需资源,资源的发布与服 务作为数字资源生命周期中与读者直接接 触的一环具有十分重要的意义。发布与服 务系统位于数字图书馆整体业务流程中面 向读者的服务阶段,是将数字资源呈现给 读者的重要服务途径。
三、数字图书馆推广工程软硬件平台的建设 1.1 、核心业务系统 —— 资源发布与服务系统 以资源为中心实现个性化服务 数字资源 古籍 缩微 论文 影视 图书 报纸 期刊 音乐 数字资源组织系统 数字资源 发布与服务系统 文献搜索系统
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.2 、业务支撑配套系统 —— 统一用户管理系统 数字化建设带来的用户管理问题 数字图书馆建设伴随着许多应用系统的建成,许多 应用系统都有自身的用户管理模块,这给数字图书 馆整体维护、管理读者信息带来了很大不便。 同时由于缺乏统一的安全认证机制,在用户信息管 理和认证方面存在一定的安全隐患。
三、数字图书馆推广工程软硬件平台的建设 1.2 、业务支撑配套系统 —— 统一用户管理系统 单点登录实名认证全国资源共享 地方图书馆 资源服务系统 使用授权 认证 读者卡用户 地方图书馆 资源浏览 系统间信任 系统间信任 国家数字图书馆 资源浏览 国家数字图书馆 统一用户管理系统 资源服务系统 读者卡用户 认证 使用授权
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.2 、业务支撑配套系统 —— 唯一标识符系统 数字资源利用率低缺乏有效管理 随着各图书馆数字资源急剧增长,资源重复建设和 嵌套使用的情况普遍存在,各图书馆各自决定自己 系统的数字资源标识方式和相应的读取方式,这种 模式阻碍了读者对数字资源的有效利用。为了提高 数字资源利用率,对各类型数字资源进行统一管理, 对数字资源进行唯一标识是极为有效地一种方式。
三、数字图书馆推广工程软硬件平台的建设 1.2 、业务支撑配套系统 —— 唯一标识符系统 数字资源唯一标识提高利用率 DATA DATA URL URL URL DATA DATA 省级图书馆资源 市级图书馆资源 唯一标识符系统 国家图书馆资源
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.2 、业务支撑配套系统 —— 版权管理系统 数字版权问题带来的建设隐患 在数字图书馆领域,数字版权问题一直是业 界讨论的热点问题,数字图书馆使网络用户 在任何时间、任何地点阅读、浏览并复制所 需要的作品成为可能,因此数字图书馆较传 统图书馆更容易涉及版权问题。数字图书馆 建设,让数字资源得到传播和利用的同时, 也要保护到著作者的权利。
三、数字图书馆推广工程软硬件平台的建设 1.2 、业务支撑配套系统 —— 版权管理系统 版权登记管理未雨绸缪 内容创建 许可认证服务器 处理 授权 内容加密&打包 发布 获取内容
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.3 、个性化服务系统 —— 中国政府公开信息整合服务平台 中国政府公开信息整合服务平台联合全国各省、市、区、县各级公共图书馆,由国家图书馆整合中央级的政府信息,省、市、县图书馆馆整合本行政区的政府信息,通过合作共建实现公共图书馆在政府公开信息的整合开发方面的统筹协调发展,以实现对各级政府信息资源的收集、整理、保存、开发、利用并服务于公众。
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.3 、个性化服务系统 —— 网页资源获取系统 网页资源获取系统是在通用的开源软件架构基础 上建立的用于网页资源采集、保存、索引、回放、 检索等功能的软件系统。 该系统将网络文档保存为符合ISO 28500标准的 WARC文档,实现了网络资源的长期保存,同时 也为图书馆员提供了一个流畅的网络资源采编存 阅的一体化平台。
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 1 、软件系统介绍 1.3 、个性化服务系统 —— 电子报纸触摸屏 电子报纸的触摸屏展示系统实时采集各大报社电子报纸数据,经过格式化处理,分发到各触摸屏终端主机,以全新的触摸交互阅读模式,将电子报纸内容及时呈现给广大读者。
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 2、软件配置标准 “数字图书馆 推广工程” 软件配置标准 软件配置标准根据公共图书馆的职能分为:省、市两级标准;标准规定了:在推广工程实施中省级馆和市级馆的必配软件系统、选配软件系统,以及必配软件代替系统要求。
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 2、软件配置标准 一般省级公共馆 必配 选配 文献 数字化 加工 系统 中国政府 公开信息 整合服务 平台 统一用户 管理 系统 唯一 标识符 系统 网页资源 获取 系统 文津搜索系统 版权管理系统 电子报 触摸屏
三、数字图书馆推广工程软硬件平台的建设 (三)数字图书馆推广工程软件平台建设 2、软件配置标准 一般市级公共馆 必配 选配 文献 数字化 加工 系统 统一用户 管理 系统 中国政府 公开信息 整合服务 平台 唯一 标识符 系统 网页资源 获取 系统 文津搜索系统 版权管理系统 电子报 触摸屏
系统平台部署情况 合计 57馆次 23馆次 8馆次 已部署 进行中 待部署 统一用户 管理系统 唯一标示 符系统 政府公开信息 整合服务平台 版权信息 15家 14家 4家 9省6市 13家 8家 4家 8省5市 29家 24省5市 1家 合计 57馆次 23馆次 8馆次
三、数字图书馆推广工程软硬件平台的建设 2013年平台建设新提升 重点系统介绍
休息一下