The Role of Classification in Knowledge-Representation and Discovery 分類法在知識中所扮演的角色 知識表徵與發掘 Barbara H. Kwasnik 指導老師:卜小蝶教授 學 生:江政哲097153111 曾嬿容097153112
大綱: 分類目的 文章摘要 現有圖書分類法的現況與問題 網路及電子資源的分類 本文的文獻參考價值討論
分類目的 在現今社會中,知識是一種經濟資源,如何管理知識、組織知識成為一個重要的面向,知識組織是知識管理中的核心,而分類是知識概念建構的過程,也是知識組織的方法之一。 傳統在圖資領域的分類是要達到資訊檢索的目的;而目前分類可達到知識的展現、知識的利用、知識的中介、知識的組織等目的 。 圖資領域的分類對象也從有形的載體,如紙張、CD,到無形的網路與電子資源。
文章摘要 這篇文章主要是在描述知識的表徵和知識的發掘的關係,會呈現出哪些知識表徵;而發掘可以指出一個好的分類的功能,可以結合概念與理念成為一個有用的結構。 文章內並介紹四種圖資領域的分類結構-階層式(hierarchies)、樹狀(trees)、矩陣式(paradigms)、和層面分析式(faceted analysis)。作者用例子介紹分類表如何呈現知識體,討論在資訊系統中知識的概念與知識描述的問題,並指出一個好的分類的功能,它可以結合概念與理念成為一個有用的結構。
階層式(hierarchies) 純粹而完整的階層式分類架構只存在於理想中,很適合用來呈現成熟的知識領域,尤其是各個知識實體間的範圍與關係相當清楚時,但並不是所有的知識領域都適合用階層式的架構來呈現。一個健全的階層式分類架構可以用來辨識某知識領域欠缺之處,進而去驗證理論對既存事實的解釋力,如杜威十進分類法。
樹狀(trees) 樹狀分類結構與階層式分類架構很像,差別在於其種屬之沒有承繼關係。樹狀分類架構需要對其知識領域有完整的認識或有高度的興趣,然樹狀分類架構善於呈現物件的在某一層面下的相對位置,但其在呈現同一層級子類之間的相關性方面之能力相當不足,而且樹狀結構只能支援部份的推論,如Yahoo的分類架構。
矩陣式(paradigms) 矩陣式分類架構最大的特色即是知識實體同時被兩項特質所描述,就是以兩個選定的特質為軸,交叉繪製成列聯表,而在其中交集的部份填入合於條件的實體。矩陣式分類架構是很好的發現知識之工具,以視覺的呈現方式,清楚地指出知識實體的進一步分析和詮釋。又因為只選擇了兩個特質,使矩陣式分類架構成為一種部份或偏頗的知識呈現。
層面分析式 (faceted analysis) 是一種類似分類的過程,以不同角度去看世界,可呈現各種臨時、動態的分類,相當具有彈性,且配合新的現像是層面分析的最大挑戰,是最符合現代知識發展步調的分類架構。當我們面臨新的、或沒有足夠理論基礎的知識領域,或是該領域的知識很複雜而需要用多向量的特質來描述,或是該知識領域正在快速進展時,層面分析式分類架構是最佳的選擇,如冒點分類法。
分類結構的結構性需求、使由理由及使用時產生的問題和限制表 階層式 樹狀 矩陣式 層面分析式 結構性需求 Structural requirement 含概性、種屬差異性、承繼性、延續性、在關聯與區別上有系統的和可預測性的規則、互斥性、必要與足夠的標準 完整且全面的資訊、系統性與可預測性的區別規則、需先決定類目建構的順序 雙向階層關係、兩個不同的屬性、交集的部份有可能是空的或有多個實體 步驟:選擇、發展、分析、發展類目順序 使用理由 Reasons to use 顯現完整且全面的資訊、擁有承繼性與標記的經濟性、可推論、清楚的定義、顯示高層次的視野與整體性的觀點 強調並表示物件實體間的關係與距離、表現出物件實體的頻率 以命名結構、區別性、差異的模式、交集的部份呈現知識 不需要完整的知識背景、親和度、彈性、表現性、不需要強大的理論基論、可配合多種理論架構與模式、多重描述
分類結構的結構性需求、使由理由及使用時產生的問題和限制表(續) 階層式 樹狀 矩陣式 層面分析式 問題與限制 Problems to use/limitations 多重階層、多重標準、缺乏全面性的知識、實體範圍的差異、缺乏延續性、分類規則僵化 結構僵硬、只能呈現單向關係、選擇性的描述 需具備該領域知識、受限制的觀點與解釋力 對建立相稱的層面是困難的、缺乏相關範圍的層面、難以視覺化呈現
現有圖書分類法的現況與問題 杜威十進分類法 (DDC) 中國圖書分類法 (CCL) 美國國會圖書館圖書分類法 (LCC) 美國國家醫學圖書館分類法 (NLM) 冒號分類法 (CC) 國際十進分類法 (UDC) 布利斯分類法 (BC) 階層式分類架構代表 最經典的層面式分類架構代表
杜威十進分類法 Dewey Decimal Classification, DDC 在1873年由Melvi Dewey提出,在1876年正式出版。2003年7月出版第22版是最新版本。主要分成十大類。 DDC已被全球超過135個國家的圖書館使用,並且被翻譯逾30種語言。 在美國,幾乎所有公共圖書館和學校圖書館都採用這種分類法。目前是由美國國會圖書館負責維護。
杜威十進分類法 Dewey Decimal Classification, DDC 優點:號碼簡明,易懂易記,且具有伸縮性; 複分號碼及部分類目具有助記性; 適合中小型圖書館,為目前各國最通用分類法之一; 具備詳盡之相關索引 。 缺點:類目太簡單無法完全標示所有學科內容;類次不合理論;類目歸屬失當;類目太偏重歐美地區。 資料來源:國家圖書館編目園地。網址:http://catweb.ncl.edu.tw/,檢索時間2008/10/31。
中國圖書分類法 Classification Scheme for Chinese Libraries, CCL 1929年劉國鈞仿DDC編訂,也是分十大類賴永祥教授賡續修訂參考LCC、DDC、現代圖書分類法、中國圖書館分類法等分類規範,並斟酌分類實務修訂而成,適用於中文圖書。於2007年易名為中文圖書分類法。 在台灣地區有相當多圖書館使用。目前已修訂至第八版,類目較偏重台灣地區使用,且缺乏相關索引。
中國圖書分類法 Classification Scheme for Chinese Libraries, CCL 優點:與DDC相同,擁有號碼簡明,易懂易記,且具有伸縮性等。因為本國人自行制定,使用上更能符合本國的國情。 缺點:與DDC相同,類目太簡單無法完全標示所有學科內容。 資料來源:國家圖書館編目園地。網址:http://catweb.ncl.edu.tw/,檢索時間2008/10/31。
美國國會圖書館圖書分類法 Library of Congress Classification , LCC LCC的設計是為了解決美國國會圖書館館藏排架之需求,因此類目十分詳盡,十分適合館藏豐富的圖書館採用。 LCC結合分類館員與學科專家一起研發,考量實際藏書及當時出版的各學科目錄而編訂。主要分成二十大類 ,是採用英文字母和阿拉伯數字混合組成的標記法 。 符合文獻保證原則
美國國會圖書館圖書分類法 Library of Congress Classification , LCC 優點:類目十分詳盡,適合館藏豐富的圖書館採用;能及時反應學科之最新發展。 缺點:類目間的附屬關係並不明顯 ;分類號有時會延伸過長,十分複雜,助記性差 。 資料來源:國家圖書館編目園地。網址:http://catweb.ncl.edu.tw/,檢索時間2008/10/31。
美國國家醫學圖書館分類法 National Library of Medicine Classification, NLM 於1951年正式發行,是專門針對健康科學而設的分類法。 NLM與LCC皆採用混合式標記,且類號的設計相容,NLM利用LCC分類法的空號QS-QZ用以表示醫預科學(Preclinical Sciences),W表示醫學及相關科目,設計成可和LC分類法合用的類表,多數醫學圖書館皆同時採用兩種分類法互為輔助。 LCC與NLM的差異主要在於LCC是依學科分類,NLM分類法是依實體分類。依作品內容的主題或重點給予分類號。 資料來源:.中國圖書館學會常用工具NLM分類法簡介。網址:http://www.lac.org.tw/ML2/tools/tools01.htm,檢索時間2008/10/31。
冒號分類法 Colon Classification, CC 由S. R. Ranganathan於1933年提出,被視為層面分析法的濫觴。是世界上最有影響的綜合性分類法之一 。 有108大類(原先是33類)和10個概括性的類目,其類號由阿拉伯數字、拉丁字母、希臘字母的混合標記所組成。每一大類有5個基本「分面」或「類組」,它們是︰主體、物質、動力、空間、時間。
冒號分類法 Colon Classification, CC 促使杜威十進分類法、國際十進分類法、書分分類法等著名的文獻分類法的修訂和一些新分類法的編制朝著分面分類的方向發展。 優勢:對新知識的包容性強;組合方式多元性,可滿足使用者多種檢索需求;對主體的表達性強,準確性高;可容納多種理論架構與模式;能及時反應新學科 限制:建構困難度高;類目體系隱含的,不易視覺化;標記複雜,檢索過程耗時;不適用於綜化學科。目前使用的很少。 資料來源: 1.中國大百科智慧藏詞條。網址:http://dblink.ncl.edu.tw/web/Content.asp?ID=249,檢索時間2008/10/31。 2.林雯瑤(2006)。層面分類的概念與應用。教育資料與圖書館學,44(2),153-171。
國際十進分類法 Universal Decimal Classification, UDC 源自於杜威十進分類法,由數字和特殊符號組成 ,至今已被譯為包括中文在內的23種文字, 英文版不僅盛行於英語系地區, 隨著盎格魯撒克森文化的流行, 也被其他國家採用。
國際十進分類法 Universal Decimal Classification, UDC UDC的利基: 標記的組合性(synthetic nature) 、類目的多面性(faceted) 優點:全球公認的標準,使用範圍廣 ;彈性大,適用於多種環境 ;免費 。 缺點:更新速度不夠快 、某些主題的分類太弱 、使用太複雜 資料來源:毛慶禎(2000)。國際十進分類法專題課程講義。輔仁大學圖書資訊學系。網址:http://blue.lins.fju.edu.tw/~mao/udc.doc,檢索時間2008/10/31。
布利斯分類法 Bliss Classification, BC 又稱書目分類法(Bibliographic Classification, BC) 。是H. E. Bliss於1935年所創制,這種體系在英國圖書館中廣泛使用,主要一些高等院校圖書館﹑政府部門圖書館和專業圖書館採用 。 主要是一種書目工具,有助於組織各主題領域的書刊資料。它共分35大類︰計9個數字類和26個字母類。
布利斯分類法 Bliss Classification, BC 成功地將傳統的分類理論同分面分類理論和技術結合起來,對一些分類法和敘詞表的編制產生了直接的影響。 特點:類表結構反映現代科學技術的發展;大量設置交替類目和參見類目,增加了類表的靈活性;類目詳盡,並有一個嚴格的分面分類體系;類表具有較強的擴充能力,能較充分地適應文獻分類工作的需要;採用回歸標記制,標記簡短,容納性強,能適應類目組配與類表發展的需要。 資料來源: 1.大英百科全書線上詞條。網址:http://www.wordpedia.eb.com/tbol/article?i=093544&db=big5&q=%A4%C0%C3%FE%AA%6B,檢索時間2008/10/31。 2.中國大百科智慧藏詞條。網址:http://dblink.ncl.edu.tw/web/Content.asp?ID=814,檢索時間2008/10/31。
網路及電子資源的分類動機 科技愈來愈發達,網路與電子資源愈來愈多,上網查詢資料已經是最重要的活動之一。面對於龐雜的網路資源,使用者要找到所需資料仍有很大的挑戰。 為了讓使用者能快速有效查詢或瀏覽資訊,將資訊做適當分類是必要的。 資料來源: 卜小蝶(2002)。使用者導向之圖書分類關聯分析研究。圖書資訊學刊,17,81-94。
分類對檢索的價值 分類提供了某種脈絡 (Context) 資訊,可降低語意的模糊性 (Ambiguity) ,讓使用者避免查詢或瀏覽大量無關的資訊。 分類的另一種價值是觸類旁通,亦即使用者可藉由各種類型的分類架構,刺激其聯想相關概念,並進一步發掘一些原本未預期到的資訊。 簡言之,分類應有助於檢索效益的提升。 資料來源: 卜小蝶(2007)。網路自動分群搜尋引擎之使用者評估研究。圖書資訊學研究, 2(1),55-80。
分類對檢索的價值 Koch & Day(1997)提供了一些分類對於網路資源檢索的價值: 便於瀏覽資訊 擴大及縮小檢索範圍 降低詞彙語意問題 提供脈絡資訊 跨語檢索的輔助 跨資料庫檢索的輔助 資料來源: 卜小蝶(2002)。使用者導向之圖書分類關聯分析研究。圖書資訊學刊,17,81-94。
分類架構於網路資源組織與檢索之應用 將分類架構應用於網路資源組織整理已行之有年,其分類架構的訂定主要有採取標準的分類表(DDC),與自訂的分類表(如Yahoo!),二者結構多為階層式或樹狀式。 面對網路資源的龐雜與多元,仍存在不少問題。
分類架構於網路資源組織與檢索之應用 Assadi & Beauvisage(2002)就認為由於網路並非百科全書,亦非圖書館,網路涵蓋了不同主題與品質的服務與資源,且網路的使用情境、使用者興趣及需求皆具多樣性,因此並不適合套用某學科領域的分類架構來整理網路資源。
分類架構於網路資源組織與檢索之應用 Schwartz(2001)認為使用者並不瞭解分類架構的設計與發展原則,因此隨著資源數量的增加,階層架構可能無法涵蓋所有資源,甚至讓使用者感到困惑。即使套用圖書分類架構來整理網路資源,困擾也不少。
分類架構於網路資源組織與檢索之應用 Schwartz提到,因圖書分類架構多以學科為基礎,未必能因應網路這樣跨學科或多學科的環境。此外,在非網路環境中,分類架構通常是與資源本身結合(如圖書的分類標籤與圖書是共同存在於特定實體),但在網路環境中,分類架構與資源則是分開儲存,其結構與設計似乎更需考量檢索上的效用,而不需侷限於學科知識體系或實體空間安排。
分類架構的網站應用實例 國圖:知識之窗 ( 網路資源選介) Vivisimo http://clusty.com/ 網路分群搜尋引擎 http://refir.ncl.edu.tw/ Subject Gateway Vivisimo http://clusty.com/ 網路分群搜尋引擎
國圖:知識之窗 ( 網路資源選介)
Vivisimo
Vivisimo
文獻參考價值討論 於Web of Science中,本篇文章被引用的次數:16 於Google Scholar中,本篇文章被引用的次數:66 其中有7篇與web、Metadata有關表示對於Web上的資訊組織而言,分類法的概念仍然是很重要的。
於Web of Science中引用本篇文章一覽表 Title: The generation of faceted classification schemes for use in the organisation of engineering design documents Author(s): Giess MD, Wild PJ, McMahon CA Source: INTERNATIONAL JOURNAL OF INFORMATION MANAGEMENT Volume: 28 Issue: 5 Pages: 379-390 Published: OCT 2008 Title: User-based identification of web genres Author(s): Rosso MA Source: JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY Volume: 59 Issue: 7 Pages: 1053-1072 Published: MAY 2008 Times Cited: 0 Title: Users can change their web search tactics: Design guidelines for categorized overviews Author(s): Kules B, Shneiderman B Source: INFORMATION PROCESSING & MANAGEMENT Volume: 44 Issue: 2 Pages: 463-484 Published: MAR 2008 Times Cited: 0 Title: Browsing and searching in a faceted information space: A naturalistic study of PubMed users' interact on with a display tool Author(s): Tang MC Source: JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY Volume: 58 Issue: 13 Pages: 1998-2006 Published: NOV 2007 資料來源: ISI Web of Knowledge http://apps.isiknowledge.com/WOS_GeneralSearch_input.do?product=WOS&search_mode= GeneralSearch&SID=3BBhbmmIFCid6F53F@o&preferencesSaved=&highlighted_tab=WOS
於Web of Science中引用本篇文章一覽表 Title: A classification of mental models of undergraduates seeking information for a course essay in history and psychology: Preliminary investigations into aligning their mental models with online thessauri Author(s): Cole C, Lin Y, Leide J, et al. Source: JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY Volume: 58 Issue: 13 Pages: 2092-2104 Published: NOV 2007 Title: Facets are fundamental: Rethinking information architecture frameworks Author(s): Crystal A Source: TECHNICAL COMMUNICATION Volume: 54 Issue: 1 Pages: 16-26 Published: FEB 2007 Times Cited: 0 Title: Cognitive dimensions 'beyond the notation' Author(s): Petre M Source: JOURNAL OF VISUAL LANGUAGES AND COMPUTING Volume: 17 Issue: 4 Pages: 292-301 Published: AUG 2006 Times Cited: 0 Title: Structure, logic, and semantics in ad hoc classification schemes applied to Web-based libraries in the field of education Author(s): Hudon M, Mas S, Gazo D Source: CANADIAN JOURNAL OF INFORMATION AND LIBRARY SCIENCE-REVUE CANADIENNE DES SCIENCES DE L INFORMATION ET DE BIBLIOTHECONOMIE Volume: 29 Issue: 3 Pages: 265-288 Published: SEP 2005 Times Cited: 0
於Web of Science中引用本篇文章一覽表 Title: Taxonomy for science and engineering indicators: a reassessment Author(s): Feeney MK, Bozeman B Source: RESEARCH EVALUATION Volume: 14 Issue: 3 Pages: 239-248 Published: DEC 2005 Times Cited: 1 Title: Sensitive information: A review and research agenda Author(s): Thompson ED, Kaarst-Brown ML Source: JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY Volume: 56 Issue: 3 Pages: 245-257 Published: FEB 1 2005 Times Cited: 0 Title: Classification for information retrieval and classification for knowledge discovery: Relationships between "professional" and "naive" classification Author(s): Beghtol C Source: KNOWLEDGE ORGANIZATION Volume: 30 Issue: 2 Pages: 64-73 Published: 2003 Times Cited: 8 Title: Can document-genre metadata improve information access to large digital collections? Author(s): Crowston K, Kwasnik BH Source: LIBRARY TRENDS Volume: 52 Issue: 2 Pages: 345-361 Published: FAL 2003 Times Cited: 5
於Web of Science中引用本篇文章一覽表 Title: Investigating how individuals conceptually and physically structure file folders for electronic bookmarks: The example of the financial services industry Author(s): Gottlieb L, Dilevko J Source: JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY Volume: 54 Issue: 2 Pages: 124-139 Published: JAN 15 2003 Times Cited: 1 Title: Models for classifying Internet resources Author(s): Zins C Source: KNOWLEDGE ORGANIZATION Volume: 29 Issue: 1 Pages: 20-28 Published: 2002 Times Cited: 3 Title: Ontology research and development. Part I - a review of ontology generation Author(s): Ding Y, Foo S Source: JOURNAL OF INFORMATION SCIENCE Volume: 28 Issue: 2 Pages: 123-136 Published: 2002 Times Cited: 21 Title: Toward a conceptual framework for complementary and alternative medicine: Challenges and issues Author(s): Zeng ML, Kronenberg F, Molholt P Source: KNOWLEDGE ORGANIZATION Volume: 28 Issue: 1 Pages: 27-40 Published: 2001 Times Cited: 2
Reference 卜小蝶(2002)。使用者導向之圖書分類關聯分析研究。圖書資訊學刊,17,81-94。 卜小蝶(2007)。網路自動分群搜尋引擎之使用者評估研究。圖書資訊學研究,2(1),55-80。 卜小蝶(2007)。網路搜尋之分類架構評估初探。2007電子資訊資源與學術聯盟國際研討會。台北:財團法人國家實驗研究院科技政策研究與資訊中心,2-1~2-13。 呂春嬌(2002)。從分類理論看分類法未來的發展與趨勢。中國圖書館學會會報,69,176-199。 宋瓊玲(2002)。從知識組織的面向探討圖書館資訊服務。國立中央圖書館臺灣分館館刊,8(1),29-37。 阮明淑(2003)。知識經濟時代的知識組織。大學圖書館,7(1),75-95。 林雯瑤(2006)。層面分類的概念與應用。教育資料與圖書館學,44(2),153-171。
Reference 8. 邱子恆(2002)。圖書資訊分類架構在組織與呈現知識上之應用。 圖書資訊學刊,17,122-137。 9. 邱子恆(2002)。圖書資訊服務業知識資源組織之研究。國立台灣 大學圖書資訊研究所博士論文,台北:未出版。 10. 邱子恆(2003)。知識資源之組織策略與方法。中國圖書館學會 會報,71,125-147。 11. 陳亞寧、陳淑君(2001)。以知識探索為本之知識組織方法論及 研究分析。圖書與資訊學刊,39,36-51。 12. Barbara H. Kwasnik. “The role of classification structures in reflecting and building theory.” In Advances in Classification Research, Volume III. (Medford, N.J. : Learned Information, Inc., for the American Society for Information Science, c1993) , 63.