CALIS专题特色数据库的建设 燕今伟 成都·2011.4.1
大 纲 CALIS一期、二期特色库子项目建设情况 CALIS三期特色库项目的设计思路 CALIS三期特色库项目建设方案 大 纲 CALIS一期、二期特色库子项目建设情况 CALIS三期特色库项目的设计思路 CALIS三期特色库项目建设方案 CALIS 三期特色库建设进展情况
CALIS一期特色库子项目 于1999年1月正式启动,2000年底验收 立项要求 共建成专题特色库25个 资助方式 具有中国特色、地区特色和高等教育特色的专题数据库(索引题录库、摘要或全文库) 数据库与“211工程”重点学科建设有较突出关系具备一定量的数据,并已有初步成果挂在SERNET网上 具有较好的设备和人员条件,网络通讯能力较强 共建成专题特色库25个 资助方式 项目分为一、二、三、四等,分别给予5万、4万、3万、1.5万元的资助 验收评为优秀项目的奖励5000元
一期特色库建设存在的问题 没有统一建库平台 没有制定数据标准 未明确规定数据库的规模和收录文献的类型
CALIS二期特色库子项目建设 2003年10月启动,2006年验收 建设目标 遵循“分散建设、统一检索、资源共享”的原则 具有相对统一的建设标准 在各校建立可独立运行的特色数据库群 建立一个基于集中式元数据库的特色资源库中心门户网站,形成分散对象数据和统一元数据集的构架 各校图书馆的建库和发布系统市场化运作,商家开发,CALIS中心认证,图书馆自行选购
CALIS中心门户/跨库检索/特色库服务系统 特色库系统总体框架图 … CALIS全国资源仓库/特色库元数据库 CALIS中心门户/跨库检索/特色库服务系统 元数据收割服务器(通过OAI协议) 参建单位系统1 参建单位系统2 资源调度系统(OpenURL)
二期特色库选题标准 数据库选题内容分为三类 学科特色资源: 与“ 211工程”某重点学科有较突出的关系,或能体现高等教育特色,或具有交叉学科和前沿学科特色 的资源 地方特色资源:具有一定的地域和历史人文特色,或与地方的政治、经济和文化发展密切相关的资源 馆藏特色资源: 具有他馆、他校所不具备或只有少数馆具备的特色馆藏 ,或散在各处、难以被利用的资源
二期特色库建库要求 数据库应具有一定规模的数据量 数据库应至少包含三种以上的文献类型(题录、文摘、全文、图像、音频、视频等) 数据库应遵循项目管理组提出的框架体系和栏目设置要求,有统一的页面风格,具有基本的数据库管理功能和服务功能 数据库应遵循数据建设规范和标引细则,进行元数据规范处理
二期特色库标准规范 建库标准采用科技部科技基础条件平台重大项目《中国数字图书馆标准规范建设》项目所推荐的相关标准 制定了特色库建设系列规范文件 《特色库子项目本地系统基本技术规范》 《特色库子项目本地系统数据标准》 《特色库子项目本地系统相关接口与规范》 《特色库子项目描述元数据规范及相关规则》 ……
二期特色库经费资助 数据库的建设和维护经费主要依靠各校自主投入,CALIS给予一定的经费补贴和奖励 参建项目分为资助性项目和非资助性项目两类 资助性项目根据其选题和建设基础分为重点资助项目和一般资助项目,资助额度分别为5万、1万 非资助性项目纳入CALIS特色库项目的管理体系,接受项目中期检查和后期成果验收 资助性项目和非资助性项目后期验收时均可以参加评奖,CALIS管理中心对获奖项目进行奖励
二期特色库的服务方式 对于二次文献,建设单位应向 CALIS 成员馆提供 WEB 方式的公开免费检索
二期特色库建设成果 共建成63个专题特色数据库 选用了7个经CALIS认证的本地建库系统 65个学校的91个项目申报 75个项目通过专家评审 资助项目46个(重点资助9个,一般资助 37个) 非资助29 个(38.7%) 64个签订了承建协议书(1个一般资助、10个非资助项目未签约) 选用了7个经CALIS认证的本地建库系统 TRS、TPI、方正德赛、 快威、义华、中数创新、杭州麦达 共有45个项目分别获得一、二、三等奖和鼓励奖,奖励额度为1万、6千、3千、1千
CALIS特色库中心网站
二期特色库建设存在的问题 本地建库系统认证工作费时费力,且认证了多个系统给参建馆选择造成困难,商家用户过少也没有积极性 特色库中心网站系统与参建馆本地系统联调及元数据收割等较为复杂,影响了整个子项目建设的进度 元数据OAI收割效果不理想 服务要求没有完全落实
大 纲 CALIS一期、二期特色库子项目建设情况 CALIS三期特色库项目的设计思路 CALIS三期特色库项目建设方案 大 纲 CALIS一期、二期特色库子项目建设情况 CALIS三期特色库项目的设计思路 CALIS三期特色库项目建设方案 CALIS 三期特色库建设进展情况
对特色库建设形势的分析 各高校图书馆有建设特色资源数据库的积极性,利用各种渠道的资金或本馆力量不断推进,特色数据库的种类和数量还在不断扩大 据CALIS管理中心的问卷调查 106所高校已建和在建的特色库共300个,其中最多的建有13个 CALIS立项的44个,仅占14.7% 已有的参建图书馆希望能在CALIS的框架下,继续改进和完善已建成的专题特色库
原来没有参建的院校图书馆也希望能够加入CALIS的建设体系 有必要继续挖掘和发布国内一些未开发的、散在各处、难以被利用的独有资源 经过十余年的建设,在建库的选题、技术路线、标准规范、组织管理等方面,各馆都积累了一定的经验,为继续开展特色库建设打下了比较好的基础
三期特色库建设的指导思想 发掘资源,整合资源,收集资源 发挥特色,深化服务,促进共享 规范建设,培养人才,鼓励创新 把在常规数据库里无法揭示的信息资源挖掘出来;强调多馆合作,联合建设;要注重对原生数字资源、非正式出版物等的收集整理 发挥特色,深化服务,促进共享 不强调重点学科,强调资源特色;发挥资源本身的特色,把资源的拥有者、服务者和使用者结合起来,扩大服务的深度;目标是共建共享 规范建设,培养人才,鼓励创新 建立一整套规范,在最基本的层面考虑规范的建设及异构系统的互操作;为高校培养一批人才,能及时应对资源建设的新变化:鼓励创新型服务,不仅仅把特色库建设看成是资源的建设,应该在普遍服务思想的指导下,思考如何建设和如何服务
与二期的不同点 扩大资源的范围 更强调需求和服务 加强对建库单位的技术支撑力度 发挥省中心的作用 搜集网络原生数字资源 申报书要求指明目标用户群 增加定向型项目:由需求方(多个图书馆)提出需要立项项目,由CALIS针对共同需求,指定或鼓励有能力建设该数据库的图书馆来进行定向建设 明确要求立项数据库最低限度应提供文献传递服务 加强对建库单位的技术支撑力度 开发特色库通用系统,免费提供成员馆使用 发挥省中心的作用 在省中心部署共享版特色库系统平台;技术支撑点
大 纲 CALIS一期、二期特色库子项目建设情况 CALIS三期特色库项目的设计思路 CALIS三期特色库项目建设方案 大 纲 CALIS一期、二期特色库子项目建设情况 CALIS三期特色库项目的设计思路 CALIS三期特色库项目建设方案 CALIS 三期特色库建设进展情况
项目建设任务 (1/2) 建设80个左右的特色数据库 新增300万条特色资源的目录数据,通过收割汇集至CALIS联合仓储数据库 文献类型覆盖图书、期刊论文、会议论文、学位论文、报纸、专利、标准、音频、视频、古籍、拓片、舆图、地方志、家谱、乐谱、照片、图像等 新增300万条特色资源的目录数据,通过收割汇集至CALIS联合仓储数据库 其中不少于30%的数据具备数字对象信息(如全文、音频、视频、图像、课件等) 建设基于SaaS技术的CALIS本地特色数据库系统共享版免费提供给成员馆使用,成员馆可在无需高成本投入、无需担心系统高成本升级的情况下开展特色库建设
项目建设任务 (2/2) 进一步完善描述元数据规范、对象数据加工规范等相关标准规范;制定特色资源组织规范、存储规范、发布规范等在内的一整套基于SaaS技术的CALIS特色数据库标准规范体系。 升级CALIS全国高校专题特色数据库中心服务系统,完善管理和服务功能
项目选题要求 独有或稀缺资源 网络原生数字资源 具有鲜明学科特色、地方特色和民族特色,且有良好前期建设成果的资源。 即只有本地或本馆独有的;或散在各处、难以收集和利用的;且商业数据库或其他公开渠道难以获得的资源 网络原生数字资源 具有鲜明学科特色、地方特色和民族特色,且有良好前期建设成果的资源。 涉及国家秘密的资源不得作为特色库选题
立项和资助 分为自由申报项目和定向项目两类 自由申报项目根据联合参建馆数量,资源的独特性、适用范围、全文比例及数据规模,数据库的服务对象范围、服务模式及预期服务效果等因素分为四个等级立项:重点资助项目、一般资助项目、后期资助项目和非资助项目 未达到资助项目要求,但希望采用CALIS统一建库标准进行建设的项目,作为非资助项目 鼓励经费充裕的项目减半申请CALIS经费,留出更多的经费资助其他项目。CALIS将对减半申请经费的项目予以表彰
建库平台 二期建设中已经通过CALIS认证的本地系统平台,可继续使用 对于未经过CALIS认证,但符合CALIS标准的也可继续使用 于2011年内提供2.0版特色库系统,用于部署在省中心,并迁移数据
运行机制 建设方式:集中组织管理、建库标准相对统一、参建学校分散建库、专家监督指导 经费来源:建设和维护主要依靠各校自主投入,CALIS 进行政策和技术引导,并给予经费补贴和奖励 资源归属:元数据及文摘级数据归CALIS所有,全文级资源归建设馆所有 人才培养:建立人力资源培训体系,开展多种方式的建库人员培训和建库学术交流活动
服务模式 所有立项特色库均须免费开放元数据并提供公开的元数据检索 所有立项特色库的元数据均须被CALIS专题特色库中心系统收割并发布 所有立项特色库中不涉及知识产权的内容应能够直接提供全文;涉及知识产权的内容应提供文献传递服务 所有立项项目必须承诺永久运行,持续服务;如果遇到特殊情况不能再继续运行,须移交CALIS,允许CALIS进行维护或将该数据库委托其他单位进行维护
项目的组织和管理 在CALIS管理中心统一领导下,成立项目管理组实施项目管理,其职责是: 项目管理组下设标准规范组和技术服务组 负责各高校图书馆特色库项目建设的申报、查重、初审和协调; 聘请专家对项目进行专业咨询、立项评审、中期检查及验收评审; 承担对项目参建馆的技术指导和相关培训等 项目管理组下设标准规范组和技术服务组 标准规范组:负责专题特色数据库各项标准规范的制定 技术服务组:建库的技术推广和培训宣传 省中心设立专人,负责本省特色库子项目的联系、协调和管理等相关工作
大 纲 CALIS一期、二期特色库子项目建设情况 CALIS三期特色库项目的设计思路 CALIS三期特色库项目建设方案 大 纲 CALIS一期、二期特色库子项目建设情况 CALIS三期特色库项目的设计思路 CALIS三期特色库项目建设方案 CALIS 三期特色库建设进展情况
前期准备工作 2010年8月,CALIS管理中心组织北京大学、清华大学、武汉大学、中国农大、重庆大学的相关人员编制了“CALIS特色库建库与发布共享版系统需求书” 制订项目建设方案 2011年1月14日,发布CALIS三期特色库子项目申报通知 2011年2月28日—3月14日,自由申报项目申报时间 2011年3月15日—4月7日,定向项目需求征集时间
自由项目申报情况统计-概况 参与单位:198家 申报项目:247个 188家单位的230个项目进行了网上申报。
自由项目申报情况统计-增长 171% 205% 247 198 91 65 参与学校数量 申报项目数量 CALIS “十五” 涨幅大的原因:1 高校图书馆建设特色库的意愿加强(2010年特色库建设情况调查,已经建设了300个库) 2 本次申请不设任何门槛儿(既没有数据基础的门槛儿,也没有系统的门槛儿) 参与学校数量 申报项目数量
自由项目申报情况统计-院校类型 各类型院校图书馆申报项目情况 211院校 本科院校 高职高专 独立学院 西部院校 新升本院校 63 31.8 % 本科院校 119 60.1 % 高职高专 11 5.6 % 独立学院 4 2.0 % 西部院校 46 23.2 % 新升本院校 28 14.1 % 0% 20% 40% 60% 80% 100% 197高校,另还有1协作单位(江苏省委党校); 如果不含211院校 119家 本科高校占 60.1% 各类型院校图书馆申报项目情况
自由项目申报情况统计-分省 各 省 自 由 项 目 申 报 情 况 江苏 27 湖北 26 广东 20 北京 19 山东 17 20个以上 15 - 19个 10 - 14个 5-9个 5 - 9个 0 - 1个 2 - 5个 北京 19 山东 17 重庆 江西 4 河北 内蒙 3 浙江 云南 2 辽宁 广西 2 西藏 黑龙江 1 宁夏 青海 1 安徽 海南 0 四川 陕西14 湖南 11 天津 福建 10 河南 9 山西 上海 8 贵州 新疆 6 甘肃 吉林 6
自由申报项目的特点-资源 汇集性资源依然居于主流,部分项目同时具有独有资源和汇集性资源、网络资源和汇集性资源特征 资源类型特征 汇集性 96.7% 独有资源 10.1% 网络资源 4.6% 汇集性资源依然居于主流,部分项目同时具有独有资源和汇集性资源、网络资源和汇集性资源特征 资源类型特征 汇集性资源239个
自由申报项目的特点-联合 联合建库项目 50个,占 20.2% 单独建库项目 197个,占 79.8% 联合建库项目占据一定比例
自由申报项目主要特点-基础 项 目 基 础 大部分项目属于新建项目 CALIS 原立项 从未立项 其他立项 30个,占12.1% 199个,占80.6% 其他立项 16个,占6.4%
自由申报项目的特点-系统 112个项目预计使用 30个项目预计使用 86个项目预计使用 申 CALIS 认证系统 报 项 目 选 用 系 统 其他自选系统 申 报 项 目 选 用 系 统 情 况
自由申报项目的特点-分类 Text in here 项目内容分类 地方文化 37 民族文化 18 地方综合 17 人 物 23 地方文化 37 民族文化 18 地方综合 17 人 物 23 古籍史料 26 自然科学 12 教 育 12 经 济 15 人文社科 25 农业科学 12 医药科学 18 工程技术 32 合计 247 项目内容分类 贵州省黔西南州地方古籍文献数据库 兴义民族师范学院 贵州全省地方志全文数据库建设 贵州师范大学 贵阳文化特色数据库 贵阳学院 河北省旧方志资源数据库 河北大学 桂西北地方资源文献数据库 河池学院 枣庄地方文化数字资源库 枣庄学院 新疆地方古籍文献数据库建设新疆大学 湖北地方文献特色数据库 湖北大学 山西地方文献资料 山西大学 河洛文化文献专题数据库 洛阳师范学院 河南地方文献专题特色数据库 郑州大学 中国地方契约文书特色资源库(浙南部分)上海交通大学
自由申报项目的特点-经费 90%以上项目申请重点资助经费额度 18.3% 18.3% 48.3% 48.3% 30.4% 30.4% 申请金额大于等于0.5万小于5万 41个 18.3% 18.3% 申请金额大于等于10万小于15万 70个 48.3% 48.3% 30.4% 30.4% 申请金额大于等于5万小于10万 111个 3.4% 申请金额大于等于15万 8个 189个项目申请的资助额度在5万以上 3.4%
特色库通用系统平台 通用特色库系统1.0版(方正DESI) 通用特色库系统2.0版 去掉了加密狗,改为软加密; 集成新的Maker版本,支持更多格式转化为ceb 41
特色库系统V1.0的工作模式
特色库系统V2.0 基于云模式开发新一代特色库系统共享版,部署在省中心,成员馆免费使用该特色库系统 集特色库、学位论文、机构库等加工和发布功能为一体 能以多种个性化的专题方式来展现资源 支持CALIS统一认证/联合认证 与CALIS数据交换系统无缝对接 与CALIS数字版权保护系统DRM集成
特色库系统V2.0的部署模式 1 系统部署在省中心,加工和发布端都安装在省中心的服务器上,本地只根据工作人员数量提供工作机即可。 44
省级特色资源共享平台建设思路 部署CALIS共享域平台——特色库系统共享版,供成员馆免费使用 部署CALIS数据交换平台,从成员馆特色库本地系统和特色库系统共享版中收集数据,形成本省特色资源联合仓库,同时上传给CALIS管理中心 在CALIS e读学术搜索平台中定制本省的特色资源,定制服务门户 依托本省特色资源联合仓库,自行构建本省的特色库中心服务平台
特色库中心服务系统 (1/2) 目标: 新的功能和特性: 针对各个高校馆的各类特色资源库,建立全国高校专题特色数据库中心系统,汇集各个高校馆的特色资源库,形成统一的集中式的特色资源仓库,为全国高校用户提供全面的各类专题特色资源导航、检索和揭示服务 新的功能和特性: (1)新的资源类型和相应的展现方式; (2)质量控制功能:对入库的数据质量进行监控和统计; (3)Web2.0特性,如用户参与评价、标签等; (4)分面检索功能:相同检索条件在多个资源类型分面上的检索; (5)具有SaaS管理和服务功能,能为不同馆提供个性化展现服务 (6)支持多语种:包括小语种数据的收割、检索与展现; (7)优化服务流程,易于使用
特色库中心服务系统 (2/2) 集成能力: (1)增加与标签评价等系统的集成:支持与标签服务和评价服务系统的集成 (2)提供统一服务接口,为用户提供个性化定制集成功能 (3)支持与“统一数据交换平台”的无缝集成,获取资源数据 (4)与统一计费系统集成,对于部分收费资源,提供按篇计费和下载服务
国外同行类似的困难 现在的情况是要用一个短期的资金来提供一个长期的服务 技术方面最主要的困难是找一个合适的软件平台 相比技术困难,组织和政策方面的困难更难解决 ——Gerard van Westrienen,Clifford A. Lynch. Academic Institutional Repositories Deployment Status in 13 Nations as of Mid 2005. D-Lib Magazine, 2005, 11(9)
重要的是体制机制建设 既要调动成员馆的积极性,还要保护大家的积极性 注意各学校对项目的管理制度 新的建议 有的学校对非资助项目有疑虑 有的学校要求通过竞争立项的才有效 有的学校有给予配套经费的激励措施 新的建议 建好共享平台后,单位和个人通过简单的申请手续后就可以开始建库,一年后评审,有发展前途的才立项 建立特色库注册制度,各校不论通过何种渠道建设的特色库都在CALIS特色库平台上进行登记,附有简明的介绍,便于彼此了解数据库选题,避免重复建设,协调相似选题和宣传推广服务
参考资料 CALIS管理中心姚晓霞,章洁. 高校特色库调查分析报告. 2010.6 Gerard van Westrienen,Clifford A. Lynch. Academic Institutional Repositories Deployment Status in 13 Nations as of Mid 2005. D-Lib Magazine, 2005, 11(9) CALIS相关工作文件
?