服務於中國研究的網絡基礎設施 A Cyberinfrastructure for Historical China Studies 王宏甦 北京大學中國古代史研究中心訪問學者 中國歷代人物傳記資料庫項目經理 2018.3.14
Hongsu Wang, Lik Hang Tsui, Peter K. Bol A Cyberinfrastructure for Historical China Studies” Hongsu Wang, Lik Hang Tsui, Peter K. Bol The proliferation of databases for the study of Chinese history and the increasing numbers of researchers taking part in their development calls for a cyberinfrastructure. A cyberinfrastructure can be conceived as a network of discipline-specific software applications and data collections and also of the personnel and the set of best practices, standards, and collaborative methods they establish. This paper discusses how participants in such a cyberinfrastructure for historical China studies can share their resources and how their communication can be facilitated by various technologies and mechanisms. 服務於中國歷史研究的網絡基礎設施 王宏甦 、徐力恆 、包弼德 數據庫、研究項目數量和參與中國文史數位研究的人員大幅增加,使得為中國歷史研究建立相應的網路基礎設施變得必要。網絡基礎設施可以起的作用在於連接對一個學科有用的電腦軟件、數據集、人才、實務做法、標準和合作模式,促進研究的進步。本文將具體論述為何要營建中國歷史研究的網絡基礎設施,以及如何從資源的共享和成員的交流兩方面實現這個目標。
開放、互聯的 API 系統
Tools 工具 Platforms 平台 Data-bases 数据库 應用程序接口(API) 可以做什麼呢
Example 例子 文本数据库Text Database 代码表 Code Table 平台PLATFORM
Example 例子 文本数据库Ctext 代码表 CBDB 平台MARKUS
對於數據使用者 增加數據 修正數據 查詢數據 Data dumps 可視化 在線系統中 APIs 連接了前端和後端 對於數據所有者 服務器 系統維護 控制數據 對於數據使用者 增加數據 修正數據 查詢數據 Data dumps 可視化 = 可控的眾包平台
CBDB 下一代開源錄入系統 – 傅群超 Not only an Interface 不只是一個界面
為了讓 APIS 鏈接不同的數據庫,必須要有通用的標準 國際圖像互操作框架 http://iiif.io/technical-details -- 調用不同機構的不同數據源 -- 一套通用的標準 -- 允許用戶在不影響原始圖片的情況下任意組合、標註、分析、操作圖片
曾蕾 Kent State University 字图书馆前沿问题研讨班:国际图象互操作框架 (IIIF) 2015.7 https://www.slideshare.net/mzeng/iiif-51120576
Textref.org – 使用 APIs 以及通用元數據標準 不同機構可以分享自己已經文本化的數據 分享的數據并不是文本本身 對公開分享和商業化數據都是有益的 當前合作者: CBETA, Ctext, 中華經典古籍庫, Kanripo
ctext 補注杜詩 杜甫 欽定四庫全書 zhonghua jingdian 讀杜心解 (唐)杜甫-著;(清)浦起龍-撰 1961年10月北京中華書局 分門集註杜工部詩 四部叢刊初編 閱讀 查詢 下載 圖片
biogref.org DNB 中研院人名權威檔案 DDBC 佛學名相規範資料庫 CBDB 中國歷代傳記資料庫 Location Person_ID Name Year born Year died Gender Dynasty Ancestral home (籍貫) DNB 9801 宋濂 1381 男 元–明 DDBC A007271 1310 元 明 金華 CBDB 10097 明 DNB 中研院人名權威檔案 DDBC 佛學名相規範資料庫 CBDB 中國歷代傳記資料庫
分享和控制數據 (免費) DATAVERSE GITHUB 分享數據 YES 私有數據 NO 版本控制 永久的唯一鏈接 (DOI) 唯一的網頁鏈接(URI) 需要本地安裝服務端
快速、穩定地記錄歷史版本的分享方案 1
快速、穩定地記錄歷史版本的 分享方案 2 (開放互聯網)
“有效的”合作需要基礎網絡設施
上海圖書館– 人名權威檔、RDF
是服務於中國研究的、需要大家協力建立的、我們 的數字人文項目(每個項目)自己的網絡基礎設施: 去中心化、數據標準化、開放互聯合作
零壹Lab 活躍的數字人文研究、教學社群