Download presentation
Presentation is loading. Please wait.
1
陳昭珍 國立臺灣師範大學圖書資訊學研究所副教授
數位典藏相關標準與規格(1) 陳昭珍 國立臺灣師範大學圖書資訊學研究所副教授 數位典藏教育訓練 陳昭珍
2
單一機構內數位圖書館/博物館系統架構圖 使用者 存取工具 識別處理 數位化資料 查詢 多媒體物件 (Multimedia Object)
詮釋資料 多媒體物件 (Multimedia Object) 瀏覽 名稱 使用者 介面 查尋清單 (finding aids) 線上陳列及展示 其他連結 單一機構內數位圖書館/博物館系統架構圖 參考資料 鑑賞文章
3
資訊服務架構圖 Web Mirrors Caches Archives Library Catalogues Commercial
Directorics Digital library Search servers Internet Directories OAI Z39.50 Search Engines Web Pointers/links to subject specific information User authentication help screens Search and merge Supply options Request supply Billing/payment Feedback Discussion lists Download facilities Viewing Licensing arrangement Copy right management Print Electronic Full Text Multimedia Internet Resources Digital Libraries Libraries Stores Archives Internet Commercial Vendors Internet Public Domain Providers Government Information Resources/suppliers Distributed Digital Access Search/Discovery Interfaces Value-added Subject Gateways Generic Gateway Mechanisms 資訊服務架構圖 數位典藏教育訓練 陳昭珍
4
美國國會圖書館系統架構圖 Digital content (at LC or awardee institution) Links:
Digital object URLs or URNs Digital content (at LC or awardee institution) Links: global identifiers URL or URN (handle) URLs or URNs Search Browse lists of terms Navigate thesaurus Other user interfaces Read paper bibliography Visit exhibition Access aids (not at LC) Item-level descriptive record (non-MARC) Finding aid (EAD) with item-level links MARC record e.g. non-MARC database at institution e.g. archive of finding aids at Other indexes or catalogs e.g. catalog at awardee institution 美國國會圖書館系統架構圖 數位典藏教育訓練 陳昭珍
5
資訊系統相關標準 作業系統 資料組織與管理 字碼標準 使用者介面 網路通訊協定 數位化檔案格式 安全規範 命名原則 程式語言 分散式檢索
IC卡 數位典藏教育訓練 陳昭珍
6
相關的標準 檔案格式 資訊組織標準 分散式資訊查尋與檢索標準 使用者介面 數位典藏教育訓練 陳昭珍
7
採用標準的原因 系統的互通 資源的分享 與軟體獨立 系統的轉移 資料的長久保存 數位典藏教育訓練 陳昭珍
8
Metadata 的種類 (重要者) FGDC Metadata Dublin Core CIMI GILS EAD MARC
Spectrum 數位典藏教育訓練 陳昭珍
9
數位典藏教育訓練 陳昭珍
10
Metadata相關技術 Metadata的語意與結構:
內容(content)與值(value):Dublin Core、 MICI、FGDC、GILS、AAT、LCSH 結構:RDF Metadata的語法: SGML、HTML、XML Metadata的查詢: Z39.50, OAI Metadata的顯示: XSL 數位典藏教育訓練 陳昭珍
11
XML顧名思義 XML(Extensible Markup Language) SGML HTML XHTML Extensible
Standard Generalized Markup Language HTML Hypertext Markup Language XHTML 數位典藏教育訓練 陳昭珍
12
標示(Markup) 基本觀念 程序性標示 (Procedural Markup) 描述性標示 (Descriptive Markup)
MS Word Document…. 描述性標示 (Descriptive Markup) XML SGML 數位典藏教育訓練 陳昭珍
13
程序性標示 (Procedural Markup)
數位典藏教育訓練 陳昭珍
14
描述性標示 (Descriptive Markup)
數位典藏教育訓練 陳昭珍
15
描述性標示的精神 內容與呈現格式分離 數位典藏教育訓練 陳昭珍
電子文件無法跨平台交換的主因是:不同的文書處理系統,在文件的呈現細節上採用不同的紀錄格式,這裡的呈現細節指的是字形的大小、字體的選擇、段落的表示、版面的設定之類的處理,這些都是屬於 platform-depedent 的特性。SGML將文件內容與呈現格式區分開來,只描述文件內容的語意結構,至於文件的呈現格式部份,留待文件最後輸出時,再配合 style sheet 標準,來定義呈現格式。 SGML可以讓 user 自行定義 tag 來描述文件內容的語意結構。文獻作者為了方便自己寫作和讀者閱讀,通常都會依據自己的思想綱要,將文獻的內容安排成合適的語意結構。例如一本書可以分成許多章,每一章可以分成許多節;一封書信可以分成寄件人、本文、收件人等部分等。標示了語意結構的 SGML 文獻,便具有了再利用的功能。 數位典藏教育訓練 陳昭珍
16
SGML (Standard Generalized Markup Language)
1986年 ISO 所制定的標準-ISO 8879 屬於描述性標示。 是一種 Meta-language HTML 是 SGML 的應用。 SGML 是 ISO 在 1986 年所訂定的標準,編號是 ISO 8879。從 SGML(Standard Generalized Markup Language)的名字來看,可能會讓人覺得它是一種 markup language,就像 HTML(Hypertext Markup Language)一樣。事實上,SGML是一種 metalanguage,是可以讓 user 自行定義 markup language 的 language。HTML 就是 SGML 的產物。 SGML 制定的背景是為了解決電子文件在交換與長期保存所面臨的問題。因為不同的文書處理系統都有專屬的文件格式,彼此之間並不能相容,例如 Adobe 的 PDF 格式、Microsoft Word 的 DOC 格式等。如果電子文件必須透過專屬的軟體才能讀取,那麼在交換及長期保存上便會有很大的困難,因為我們不能保證透過網路取得的文件,我們都能有相應的軟體可以讀取,像現在有些在 Internet 上讓人 download 的文件,就針對不同的軟體提供了不同的版本,如:TXT file、HTML file、PDF file、PostScript file 等;我們也不能保證一份電子文件保存了十年、二十年之後,是否還能找到相應的軟體來讀取,以現在軟體技術更新的速度來看,一套文書處理系統能不能有十年、二十年都很難說。 而 SGML 是藉由將文件的內容與呈現格式分開處理的概念,來解決電子文件跨平台交換與長期保存的問題。 SGML文件除了具有跨平台交換與長期保存的特性外,也具有再利用的功能。 數位典藏教育訓練 陳昭珍
17
SGML 的特色 有彈性 (flexibility) :
能描述任何的資訊結構與任何複雜的文件。 非專屬性 (non-proprietary)、平台獨立性(platform-independence) 與系統獨立性 (system-independence) : 利於文件的交換與長期保存。 資訊再利用性 (re-usability) 數位典藏教育訓練 陳昭珍
18
SGML文件的組成 SGML declaration DTD (Document Type Definition)
指定文件所使用的字集及特定的選項功能。 DTD (Document Type Definition) 定義文獻所包含的 elements。 定義 elements 的內容與屬性。 ... DI (Document Instance) 加上標示的文件。 SGML 文件主要包含了三個部分。第一部份是宣告的部分,主要是指定文獻中所使用的字集及某些 SGML的特定功能,通常可以省略宣告的部分,SGML 文獻會採用預設的宣告。 第二部分是 DTD,主要是定義文獻的類型及結構,包括文獻所包含的 elements(即可以使用的tags),及 elements 在文獻中出現的順序與每個 element 的屬性。 第三部分是 Document Instances,簡稱 DI,即是加上標誌的文件。 數位典藏教育訓練 陳昭珍
19
SGML發展的限制 SGML應用程式不易開發 SGML文件不易在Web上傳佈 缺乏廠商的支援 數位典藏教育訓練 陳昭珍
20
HTML (Hypertext Markup Language)
是 SGML 的應用: HTML 2.0/3.2/4.0 DTD目前 Web 上寫作網頁的標準資料格式 簡單易學 具可攜性 (portable) 可結合超連結 (hyperlink) 與多媒體 數位典藏教育訓練 陳昭珍
21
HTML的特性 HTML DTD 的設計主要是為了滿足線上顯示的需求 HTML有內建的樣式 (style)
HTML引用SGML的標示最簡化特徵 HTML沒有採用 SGML 的超連結機制 數位典藏教育訓練 陳昭珍
22
XML催生─ HTML的限制 結構上的限制 資訊再利用的限制 資料交換的限制 自動文件處理的限制 無法支援較精確的查詢
各家廠商推出的 HTML Extension 不相容 數位典藏教育訓練 陳昭珍
23
XML(Extensible Markup Language)
W3C Recommendation 10-February-1998 XML 1.0 大廠支持:Microsoft、Netscape、Sun... XML is SGML-- rather than HTML++ 取 SGML之長,補 HTML之短 允許使用者依據需求,自行定義 tags 能在 Web 上傳遞 HTML 不夠用,尋求新標準。 SGML 有彈性,夠用,但太複雜。 取 SGML 之長,補 XML 之短。去掉 SGML 較複雜、不常用的 rules,使得 application 開發的成本能大幅降低。 數位典藏教育訓練 陳昭珍
24
Major Vendor Support Sun’s XML Support Microsoft’s XML Support
IBM’s XML Support Netscape’s XML Support Oracle XML Support 數位典藏教育訓練 陳昭珍
25
W3C Data Format 數位典藏教育訓練 陳昭珍
Similar presentations