学科信息门户建设 ——基于Primo的学科文献整合 陈鹏飞 以色列艾利贝斯有限公司北京代表处 pengfei.chen@exlibris.com.cn
大纲 一、学科信息门户的定义 二、学科信息门户的发展现状 三、学科信息门户面临的关键问题 四、基于Primo的学科文献整合
一、学科信息门户的定义——概念的提出 Subject Information Gateway(SIG)、Subject-Based Information Gateway (SBIG)、Information Gateway、Information portal 国际联合信息系统委员会的定义:学科信息门户是一种基于网络的、将 多种分布式资源集合为统一整体的服务,并通过跨库检索、用户个性定 制、数据挖掘等多种网络和通讯技术,将有关信息资源集成比较,然后 智能化的提供给用户。 张晓林教授:学科信息门户致力于将特定学科领域的信息资源、工具和 服务集成到一个整体中,为用户提供一个方便的信息检索入口。
二、学科信息门户的发展现状—— 国内外学科信息门户的发展方向 二、学科信息门户的发展现状—— 国内外学科信息门户的发展方向 学科导航 检索服务整合 跨学科门户检索的学科信息门户群 基于信息门户群的信息服务 开放数字信息服务机制
二、学科信息门户的发展现状 截至2012年,全国高校图书馆共有117个图书馆建立了学科信息门户 已建立的学科信息门户总数为632个
二、学科信息门户的发展现状 文本 动画 图片 音频 视频 其他 学科信息门户覆盖资源内容 文章 图书 网络信息 信息服务 资源格式 文献类型
三、学科信息门户发展面临的问题 人工选择和筛选信息,资源更新受限于人力,自动化程度待改进。 覆盖资源类型多样,如何整合统一检索? 专业化?大众化?如何取舍? 多语种服务? 多种信息服务集成的统一入口? 跨学科领域的数据互操作方法
四、基于Primo的学科文献整合
整套参考实现的体系图 View …… 学科书架 学科馆员 Primo云端中心某一专享视图 Pipe View 专家学者 图书馆A的授权资源 整套参考实现的体系图 Scope 图书馆B的授权资源 学科馆员 View Primo云端中心某一专享视图 …… 自己图书馆的资源 学科书架 OAI-DP 专家学者 View 某图书馆用Primo搭建的学科门户 Pipe OAI-HP
Primo资源发现系统的用户(中国内地) 上海交通大学图书馆 清华大学图书馆 中国社会科学院图书馆 中国农业科学院农业信息研究所 中国科学院高能物理研究所 东北师范大学图书馆 中国国家图书馆 郑州大学图书馆 广西大学图书馆 中共中央党校图书馆 东北大学图书馆 北京师范大学图书馆 电子科技大学图书馆 协和医科大学图书馆 北京交通大学图书馆 北京邮电大学图书馆 首都图书馆 湖南大学图书馆 四川大学图书馆 复旦大学图书馆 天津社科院图书馆
Primo资源发现系统实例的数据组成 组成:图书馆所购买的资源+可免费开放获取的资源 整合步骤: 整理出一份图书馆所购买资源的列表; 列表中各项资源的元数据可以通过如下方式覆盖: 在Primo Central中勾选相应的资源集合,被勾选资源的元数据可以被 Primo实例检索到; 元数据在Primo Central 通过元数据本地装载的方式,从原库导出、转换、再导入Primo; 元数据在图书馆本地服务器 在Primo实例的管理端,勾选第三节点,通过Deep Search检索接口检索 到相应第三节点的元数据; 元数据在第三节点服务器
Primo资源发现系统实例的数据组成 Primo 实例 Primo Central 资源集合1 ...... 资源集合n 第三节点 NSTL 万方 读秀 本地装载 资源库1 资源库n Primo资源发现系统实例的数据组成
Primo用户可共用的服务 注:绿色的节点表示可共用的服务 Primo 实例 Primo Central 资源集合1 ...... 第三节点 NSTL 万方 读秀 本地装载 某些 资源库 Primo用户可共用的服务 注:绿色的节点表示可共用的服务
搭建在云端的Primo资源发现中心实例 Primo 云端中心 复旦大学 北师大 社科院 清华大学 四川大学 上海交大 ...... 授权
关于授权 图书馆Primo实例向Primo云端中心授权,实质是对本地装载的元数据 的授权: Primo Central 资源集合1 ...... 资源集合n 第三节点 NSTL 万方 读秀 本地装载 某些 资源库 关于授权 图书馆Primo实例向Primo云端中心授权,实质是对本地装载的元数据 的授权: 可以对整套Primo资源进行授权,也可以只授权其中的一部分资源。
关于授权 配置方法:以Primo云端中心整合[国家书目Primo-CNB]为例: 访问CNB的管理端,修改Mapping表:WS and XS IP
关于授权 配置方法:以Primo云端中心整合[国家书目Primo-CNB]为例: 将Primo云端中心的服务器IP增加到列表中,完成CNB对Primo云端中 心的授权
Primo云端中心完成对授权用户的资源整合 上海交大 清华大学 社科院 复旦大学 北师大 四川大学 ...... 第三节点 第三节点 第三节点 第三节点 第三节点 第三节点 第三节点
关于Primo云端中心的第三节点配置 配置方法:以Primo云端中心整合 [国家书目Primo-CNB]为例: 修改配置文件: /exlibris/primo/p4_1/ng/primo/home/ system/search/conf/thirdnode-config.xml 在节点adaptors_config下增加CNB的 第三节点适配器配置信息adaptor_config (如右图所示)
为图书馆[学科馆员]配置专享的云端检索 Primo云端中心的管理员在云端中心配置View 图书馆学科馆员的检索范围可以定制 Scope e 北京邮电大学邮电通信数据库 清华大学Primo 复旦大学Primo 国家书目Primo(CNB) 社科院Primo 四川大学Primo 北师大Primo 首都图书馆Primo …… 学科馆员 View Primo云端中心某一专享视图
为学科馆员定制主题检索项
开发“学科文献收藏功能”
开发“学科文献收藏功能” 添加时弹出学科列表,供学科馆员选择。确定后,将当前文献添加 到指定的学科下,存于学科书架内。
开发“学科书架”功能 在学科馆员Primo云端中心专享界面的右上角,点击“学科书架” 已被加入到 “学科书架”的文献
开发“学科书架”功能 在“学科书架”中: 左侧为学科导航,点击学科节点,在右侧展现该学科下的文献; 文献可以被移出学科书架; 学科书架下的文献数量无限制;
利用OAI-DP发布学科文献数据 在Primo云端中心,开发OAI-DP功能 基地址(BaseURL)= http://hosted.cceu.org.cn/oai-dp + /图书馆机构代码(如thu、bupt等) 形如: http://hosted.cceu.org.cn/oai-dp/thu 元数据标识符(identifier)= oai:cceu.org.cn:图书馆机构代码/PNX中的recordid 形如:oai:cceu.org.cn:thu/TN_gale_ofa277190222 学科信息放置在header-setSpec元素下: 形如: <header> <identifier>oai:cceu.org.cn:thu/TN_gale_ofa277190222</identifier> <datestamp>2004-11-25T09:15:07Z</datestamp> <setSpec>cs(计算机科学的学科英文简称)<setSpec> </header>
利用OAI-DP发布学科文献数据 在Primo云端中心,开发OAI-DP功能 元数据(metadata),直接放置PNX元数据。PNX如下图所示:
利用OAI-DP发布学科文献数据 在Primo云端中心,开发OAI-DP功能 对收割授权: 对于允许收割数据的HP,在DP端,需要配置对方的IP地址进行授权; 这里的HP,实际上就对应图书馆的Primo实例; 学科书架中的记录如果被收割过,且之后又被移出学科书架 对于这样的文献元数据,OAI-DP需要能够以Deleted的方式发布数据;
图书馆Primo实例收割学科数据 图书馆Primo实例具备OAI-HP能力,可以OAI-PMH方式收割数据 创建Data Sources:
图书馆Primo实例收割学科数据 图书馆Primo实例具备OAI-HP能力,可以OAI-PMH方式收割数据 创建Normalization Rules Set:
图书馆Primo实例收割学科数据 图书馆Primo实例具备OAI-HP能力,可以OAI-PMH方式收割数据 创建收割Pipe:
图书馆Primo实例收割学科数据 从而,图书馆Primo实例完成了对Primo云端中心本馆学科数据的收割 定期自动收割; 增量收割;
图书馆Primo实例发布学科数据 专家学者及研究人员访问的门户系统 定制学科门户的View 由图书馆Primo实例定制(View); 整个学科数据的选取、传输、处理对读者透明; 学科馆员的工作系统在云端,专家学者及研究人员的门户在本地; 定制学科门户的View 该定制过程与Primo首页的定制过程流程一致;
图书馆Primo实例发布学科数据 在图书馆Primo实例的管理端配置View 创建Search Scope 创建View,选取相应的Scope
整套参考实现的体系图 View …… 学科书架 学科馆员 Primo云端中心某一专享视图 Pipe View 专家学者 图书馆A的授权资源 整套参考实现的体系图 Scope 图书馆B的授权资源 学科馆员 View Primo云端中心某一专享视图 …… 自己图书馆的资源 学科书架 OAI-DP 专家学者 View 某图书馆用Primo搭建的学科门户 Pipe OAI-HP
学科门户服务与Primo功能对应 文献的检索(小而精的资源) 从广而深的文献资源中,通过主题搜索、学科馆员参与建设,完成学科文献的精细化; 文献的获取 文献的推荐 文献的管理 文献的推送 从广而深的文献资源中,通过主题搜索、学科馆员参与建设,完成学科文献的精细化; 通过与SFX整合,完成全文访问,完成与馆际互借及原文传递系统的整合; 文章级的学术推荐服务bX; 导出为文献管理工具可利用的数据结构; 基于检索式的文献保存与提醒,将检索结果发送到电子邮箱;
开展用户之间的合作 资源的共享 元数据; 通过Primo的Deep Search接口; 文献获取的协作 馆际互借; 原文传递;
谢谢! Thanks 陈鹏飞 以色列艾利贝斯有限公司北京代表处 pengfei.chen@exlibris.com.cn