Download presentation
Presentation is loading. Please wait.
1
资源数字化中心的建设与实践 郑晓惠 清华大学图书馆
2
目标 为了满足用户对文献数字化的要求,2003年,清华大学图书馆决定建立资源数字化中心。
该中心的建设目标是生产和管理高质量的数字化对象包括文本、图像、声频、视频信息,以支持各个数字化项目的建设。
3
两种选择 第一种:图书馆提供设备与场地,业务外包给公司,这种模式的优点是图书馆不需太多人员投入,缺点是对整体流程不熟悉,而且图书馆不能支配数字化流程,不能随意增加额外的任务。
4
两种选择 第二种:图书馆组织人员来进行加工,这种模式的缺点是图书馆管理大量临时人员的经验不足,容易效率低下。
优点一:可以了解整个流程。各项相关研发如元数据方案的制定、著录系统的开发、电子书展示模式、OCR技术的应用等等都是在资源数字化中心得到实践和检验,才可能得到优化和需求功能的完善。
5
两种选择 优点二:在数字化本馆特藏,特别是一些珍本、善本时,出于安全和易于加工两方面原因也需要本地有一套数字化流程。
优点三:为将来数字馆藏的发展提供在生产加工、技术研究、标准制定、成本分析等方面的经验。
6
资源数字化中心成立的考虑 2003年3月,从自己的实际情况出发,决定选择第二种模式,以“中美百万册书数字图书馆(CADAL)”项目为依托,自筹资金建立资源数字化中心,挂靠数图室。目前投入为30多万(存储与设备)。 建设思路:“采用技术手段提高工作效率”。
9
设备与人员 3台AVA3, 1台FB6000E, 1台PS7000, 1台高扫。 资源数字化中心雇佣加工人员12名,
6人为扫描加工人员,6人为后续处理及电子书制作人员。 图书馆技术人员1名,负责流程及机器管理 管理人员1名,负责中心的整体建设。 年扫描能力: 5,000,000 page/year
10
在建项目 CADAL (中美百万册书数字图书馆) 2003年——2006年7月完成38000册电子书 ,目前完成34885册。
CMDL (中文数学数字图书馆) 目前已完成电子图书145册,扫描页数为48447页。详细情况见:
11
在建项目 CALIS电子教参书项目 目前完成488本电子教参书
12
预建项目 中国科技史数字图书馆 教育资源数字图书馆(学位论文、教参、相关网页导航) 清华文库
13
资源中心整体框架 数字内容创建 内容管理 内容展示 数字资源存储
14
数字内容创建 数字化流程包括: 资源整理 (选择,查重,唯一标识符的分配) 扫描 图象处理 元数据著录和打包 质量控制 数据存储和备份
15
例:古籍扫描 (双页,页面向下)
16
去污,居中 CADAL制作工具图像处理
17
切分 (批处理)
18
旋转180 (批处理)
19
纠偏 (批处理)
20
格式转换 (批处理)
21
元数据著录与打包
22
选用相关软件 扫描: QuickScan… 图象处理: Bookshop, ACDSee, XnView, UltraEdit, Scanfix, DjVuerPro,… 元数据著录和打包: CADAL Cataloging Tool, OEBEditor, CMDL Cataloging Toolkit,… 数据传输: DResManages
23
提高效率的措施 图像自动处理功能 (去污,纠偏,居中,切割等预处理) 人员定额制 流程工业化 集中存储与调用
24
Gigabit Ethernet Switch
网络拓扑和数据存储系统 WAN Gigabit Ethernet Switch NAS 2T备份系统 DAS Dell 220S存储系统 平板扫描仪4台 高扫1台 12台人工处理机 6台自动批处理机 LAN 网关 PS 7000扫描仪
25
内容管理与展示 内容管理系统的选择 比较软件:TRS, DIPS, MetaWorks, CDI CM等。
思路:比较国外系统如:Fedora,Dspace, Greenstone,Digitool,进行功能分析,完善国内内容管理系统的功能.
26
未来计划 无版权争议的馆藏资源逐步数字化 (三年计划,三个项目) AV资源的采集 加强内容管理、组织和展示 寻求更多数字化合作项目
27
思考 馆藏资源数字化的角色 成本分析
28
谢谢!
Similar presentations