CADAL项目建设进展与规划 CADAL项目管理中心 2009-6-3 @ 杭州
主题 CADAL项目总规划 项目一期建设概况 项目当前进展 项目二期目标与思路 项目二期建设内容 项目二期实施方案
CADAL项目总规划 项目名称 项目建设总目标 大学数字图书馆国际合作计划 China Academic Digital Associative Library 项目建设总目标 构建拥有多学科、多类型、多语种海量数字资源,由国内外图书馆、学术组织、学科专业人员广泛参与的,提供高技术水平的学术数字图书馆。
CADAL项目总规划 项目建设期 项目一期建设100万册(件)数字资源,国家投入7000万元,美方合作单位投入约200万美金,“十五”期间已经完成。 二期建设将在一期百万册的基础上,完成300万册(件)数字资源,并在浙江大学建设一个数字图书馆数据服务中心,实现数据安全和全球服务,由国家投入3.5亿建设资金,计划在三到五年内完成。 三期建设在继续扩大资源建设的同时,在资源整合的基础上实现知识重构和信息创新,形成集资源采集、信息重组、内容创新、按需发布、个性服务为一体的学术数字图书馆体系。
项目一期建设概况 2000年中美启动“百万册书计划” ,定名为“中美高等教育数字图书馆”,简称CADAL。 项目启动大会·2004-11-5 2000年中美启动“百万册书计划” ,定名为“中美高等教育数字图书馆”,简称CADAL。 教育部“211”十五期间三大建设工程之一,国家投资7000万元。 浙江大学、中科院研究生院共同牵头,构建中国高等教育数字化图书馆。 项目验收会·2006-8-3
项目一期建设概况 数字化进展(截止项目验收) 到2008年底 图书加工总量: 1,023,425册 审核可发布资源:932,504册 服务资源: 700,000册以上 资源存储容量: 超过 100 TB 到2008年底 图书加工总量达:1,428,654册 已审核可发布资源:1,362,504册 已发布资源:1,250,591册 资源存储容量: 超过 150 TB 单月下载达4418.95GB,相当于每天5000多册书
项目一期建设概况 资源特点 世界上最大的公益性数字图书馆 较齐全的敦煌文献数字化特藏 较完整的数字化民国图书收藏 完备的儒道佛文献集合 全面的数字图书馆支撑技术 资源特点 学术性强,服务于教育科研 技术标准高,充分考虑资源长期保存和增值应用 数据量大,开放程度高,是各类科学研究的资源库和测 试床。
项目一期建设概况 CADAL项目对于抢救与数字化保存处于濒危状态的古籍、民国图书等珍贵的民族文化遗产起到了十分重要的作用。 扫描前民国图书 民国图书扫描后的页面 修补后上架的民国图书
图书扫描 巨幅画面扫描 三维物体扫描 扫描后处理
领导视察 高度重视
领导视察 高度重视
领导视察 高度重视 陈至立国务委员批示: “此事具有十分重要的意义。浙江大学己做了大量工作,数字化的技术和人才力量均较强,有基础、有优势。请发改委、教育部统筹研究有关部门和学校此类项目进展情况,择优给予重点支持,加快图书数字化工作,并使其成果广泛共享。”
各级领导,先后视察
国际合作与交流 参与全球数字图书馆计划(UDL) 由中国教育部、美国国家科学基金会、印度科学院联合主办,主持召开首届全球数字图书馆学术研讨会(ICUDL2005), 2005年10月31-11月2日在浙江大学顺利召开,并取得圆满成功。
国际合作与交流 MBP 继美国、印度之后,澳大利亚、埃及以及东南亚周边国家和地区纷纷表达了合作、共建的愿望,并前来交流洽谈。
项目当前进度 (一)学校高度重视, 项目进展顺利 在完成“十五”项目总体建设目标和任务之后,两年来,张曦书记、杨卫校长多次听取项目建设汇报,并在校党委常委会、校长办公会上指示将CADAL项目列为全校重点项目。 项目负责人潘云鹤院士多次召集项目管理中心会议,指示二期建设思路,讨论二期建设方案。 截至2008年底,浙江大学投入建设经费一千余万元,继续文献资源的组织和扫描工作,保持国内外最大的公益性数字图书馆的地位,为下一期项目建设奠定坚实基础。
项目当前进度 (二)开展广泛调研,完善资源保障 为扩大数字资源共建共享范围,根据教育部高教司有关领导的指示,项目资源建设委员会对全国“985工程”高校和具有特色资源的高校进行了较为广泛的二期项目调研。 收到有意向参与二期项目建设的回复31份,包括“985工程”高校12个(未计一期参加的15个985高校),其他特色资源高校19个。调研得到的计划数字化文献资源150余万册(件)。 项目管理中心于2007年底在广西召开了项目验收以后的第一次工作会议,并于2008年先后三次召开二期方案征询会,一期建设核心馆、参建单位及二期拟加入单位在听取了项目过渡期工作报告及二期方案后,踊跃提出二期建设的建议和思路,表达了共同完成项目的热情和信心。
项目当前进度 (三)加强技术研发,深化资源服务 升级CADAL门户网站,提供资源检索和个性化服务功能。日均点击达到40万次以上,每天下载浏览图书近5000册,149,672页。 重点突破了海量资源组织、存储和服务等关键技术。实现了古籍、民国图书、民国期刊、现代图书、学位论文、绘画、视频等多种资源的并行检索。 通过资源的二次组织,开发孔子学院数字图书馆服务平台,面向中国对外汉语言文化交流提供资源保障和服务支撑。 OCR系统稳定运行,每天完成4000册图书的字符识别,为二期全面实现资源的全文检索做好了准备。
项目当前进度 (四)拓展对外交流,开展国际合作 与印度和埃及初步达成合作意向,同时与美国伊利诺大学香槟分校(UIUC)签定了数字图书馆合作备忘录。 与Internet Archive、Open Content Alliance (OCA)、牛津大学出版社(OUP)等机构起草、拟定了合作协议,近期将逐一签署并实施。
项目当前进度 (四)拓展对外交流,开展国际合作 2005年10月31-11月2日由浙江大学主持召开首届全球数字图书馆 学术研讨会(ICUDL2005), 取得圆满成功。 2006年11月埃及亚历山大图书馆主办第二届ICUDL 2007年11月美国CMU图书馆主办第三届ICUDL 2008年11月印度科学院主办第四届ICUDL 2009年11月美国CMU加州分校主办第五届ICUDL
项目当前进度 (五)抓紧二期筹备,合作双贏发展 注重对外宣传与合作,2007年11月27日与美国合作方一起举办了项目资源对外服务的国际新闻发布会,引起高度关注和热烈反响。 与国家图书馆共同发起数字图书馆建设联席会议制度,邀集国家层面的八个数字图书馆项目建设管理者进行了广泛交流和磋商,确定了“合作共建、互助多贏”的方针。至今已召开七次工作会议。 2008年与国家图书馆、上海图书馆、文化部文化共享工程、中央党校数字图书馆以及国防大学数字图书馆先后签订了合作框架协议或备忘录。
项目当前进度 国家图书馆 上海图书馆 文化部文化共享工程 中央党校数字图书馆 国防数字图书馆 国内16所高校参建馆及50余所拟申报馆 香港大学、香港中文大学等港澳学术机构 印度科学院 泰国朱拉隆宫大学 埃及亚历山大图书馆 美国卡内基·梅隆(CMU)大学 伊利诺斯大学香槟分校(UIUC) 哈佛大学燕京图书馆 新西兰奥克兰大学图书馆 全球数字图书馆计 划(UDL) Internet Archive,IA IBM、HP ……
项目二期目标与思路 项目二期目标 制定和完善从资源采集、组织、管理、安全、永久保存到服务利用等一系列数字图书馆标准规范; 进一步扩大数字资源建设的范围和数量,完成300万册(件)文献资源的数字化制作,使项目的数字资源总量达到400万册(件),继续保持国内外公益性数字图书馆规模的领先地位;
项目二期目标与思路 项目二期目标 深化技术支撑环境建设,为我国数字图书馆建设提供有力的技术保障,使其整体水平居于国际领先地位; 强化数字资源服务体系建设,根据《著作权法》和《信息网络传播权管理条例》的规定,分层次对项目参建单位、全国高等学校和社会公众提供数字资源服务,充分发挥项目的社会效益;
项目二期目标与思路 项目二期目标 加强数字图书馆领域的对外合作与交流,在全球范围开展包括资源、技术、人才、服务等多方面交流与合作,提高我国数字图书馆在国际上的影响力,促进我国数字图书馆建设的全面提升和有效共享。
项目二期目标与思路 项目二期思路 通过对外合作与交流,组织、建设各类学术资源,构建提供个性化知识服务的数字图书馆支撑环境,为教学科研与文化传承服务。 具体概述为“拓展资源建设、推广服务体系、强化支撑环境、扩大对外合作”。
项目二期建设内容 拓展资源建设 完成300万册(件)多学科、多语种、多类型资源的数字化制作,保存和传承优秀科技、学术资源。 重点建设中文和中国学术、文化资源以及研究中国的非汉语资源;完成资源质量提升,形成一批独具特色的资源库。 加强资源整合,在自建资源的基础上,通过强化知识组织实现对各类引进、购买资源的统一服务。 建立若干个资源数字化基地,形成国内最大的资源数字化加工网络。
项目二期建设内容 拓展资源建设 中文古籍:10万卷(件) 民国文献:10万册(期) 中文图书:30万册 中文报纸:20万期 民国图书:2万册。 民国期刊:7万期。 民国报纸 1万期 中文图书:30万册 中文报纸:20万期
项目二期建设内容 拓展资源建设 外文图书:40万册 外文会议论文 30万篇 外文技术报告 20万篇 科技档案 20万篇 外文会议论文 30万篇 外文技术报告 20万篇 科技档案 20万篇 灰色文献 37万件 包括: 满铁资料15万件, 侨批8万件, 地方志8万册, 少数民族资料6万册
项目二期建设内容 拓展资源建设 资源建设总则 美术作品: 75万幅 声像资料 8 万件 人无我有,人有我优; 点面结合,中外汇聚。 美术作品: 75万幅 含国画、书法、篆刻、油画、版画、雕塑、摄影、建筑、服装、皮影、标本等等 声像资料 8 万件 资源建设总则 人无我有,人有我优; 点面结合,中外汇聚。
项目二期建设内容 推广服务体系 保证高校用户的资源获得率和服务满意率,满足大部分高校对于特定数字资源的需求。 建立跨学科、跨媒体的立体知识结构框架,提供具有知识创新能力的数字资源集成服务。 与科研机构以及地方政府紧密合作,提供资源与增值服务。特别是省内县、乡、镇和西部省市的资源需求。 强化数字资源服务体系建设,在全国建设若干个数据服务中心,实现分布式服务。
项目二期建设内容 推广服务体系 积极寻求可行的知识产权解决方案 开放元数据共享,共同构建共享知识库 实践多维度分类的导引模式 提供个性化信息环境 尝试呼叫中心与资源服务中心相结合的分布式多级服务体系
项目二期建设内容 强化支撑环境 深化技术支撑环境建设,以资源建设和用户服务为中心,建设项目需要的软硬件基础环境,研发满足项目建设需要的应用软件。 立足项目实践,遵循国际数字图书馆建设的互操作规范,引进、完善和制定从资源采集、内容管理到信息服务的一系列标准规范。 制定和规范开放访问接口,建立面向合作单位与其他机构的信息交换与共享平台。
项目二期建设内容 强化支撑环境 实现数字图书馆新型体系结构,优化系统的元数据管理与内容管理,为深层次信息服务体系的建设提供关键技术支撑。 通过OCR、跨媒体、数据挖掘、语义网络、知识发现、虚拟现实等相关技术的研究,使我国在计算机海量信息处理领域拥有创新的理论与技术。 开展数字图书馆工程化、产业化技术研发,依托数字图书馆教育部工程研究中心建设,促进高校之间的资源整合与共享、增强高校的科技创新能力、提升高校的社会服务功能。
项目二期建设内容 中国书画系统 中国文学史研究信息系统 中医药综合信息服务系统 中国传统艺术信息服务系统 艺术/科研人员个性化信息服务 跨媒体知识表达 图书 图像 视频 音频 互联网信息 灰色资源 资源层 知识层 主题词表 主题图 交叉关联图 本体 语义单元 语义网 跨媒体信息分析 知识组织、管理、挖掘 平台层 协同交流平台 知识管理发布平台 跨媒体可视化 个性化 自然语言理解 语言翻译 应用层 特色服务 特殊服务 普通服务 海量跨媒体信息的知识管理与挖掘 跨媒体智能检索与推理技术 主动信息服务技术 多语言自动翻译 沉浸式跨媒体数字图书馆阅读平台 数字图书馆新型输出技术平台 数字图书馆标准 数字图书馆存储机制 新型/特种媒体资源数字化集成技术 中国书画系统 中国文学史研究信息系统 中医药综合信息服务系统 中国传统艺术信息服务系统 艺术/科研人员个性化信息服务
项目二期建设内容 扩大对外合作 制定数字图书馆建设对外交流与合作的相关标准规范集; 引进建设数字资源40万册/件。其中,组织引进流失海外的汉籍资源1万册/件,外文资源引进建设19万册/件,外文资源交换20万册/件; 通过与海外数字图书馆共建进行技术合作和人才交流,建立高素质的数字图书馆建设队伍; 着眼于国际上有巨大影响力的数字图书馆,在元数据融合的基础上实现与其他数字图书馆的无缝融合,为读者提供共享服务和增值服务。
项目二期实施方案 由浙江大学计算机专家潘云鹤院士担任项目负责人。由设立于浙江大学的项目管理中心组建一系列职能部门负责组织建设。 资源建设事务所 对外合作与交流事务所 咨询服务部 研发部 数据部 质检部 办公室等
项目二期实施方案 组织专家咨询委员会和资源建设委员会 专家委员会协助制订、审核工作方案和工作计划,参加对项目中重大建设内容的检查、评估和验收工作;对技术路线选择、设备选型等重大技术问题进行专题论证,提出咨询意见;对项目建设提出改进建议等。 资源建设委员会负责制定项目资源建设的目标和内容;论证项目资源建设的必要性和可行性;对资源选择与加工进行指导,协助资源组织和评估等。
项目二期实施方案 依托参与一期建设的浙大、北大、清华、南大、复旦等核心承建单位构建分布式服务体系。 与数字图书馆教育部工程研究中心紧密合作完成支撑环境建设。 在一期十六所参建单位基础上,扩大参建高校和单位, 组织更多的文献资源进行数字化共建共享。 争取参建高校总数达到50至55所; 以参建单位为中心,进一步扩大在该省(自治区、直辖市)范围内的共建共享高校及其他学术和文化机构。
结束语 数字图书馆关系到全球文化多样化和中华民族的文化安全,是民族得以传承、国家得以维系的精神支柱和重要基础。 数字图书馆是国家知识创新的主要基础设施,也是世界各国21世纪文化科技竞争的新焦点之一。
合作共享、再创辉煌 谢谢大家!