柯皓仁 國立臺灣師範大學圖書館、圖書資訊學研究所 理想的學術資源探索系統 柯皓仁 國立臺灣師範大學圖書館、圖書資訊學研究所
Outline 簡介 聯合索引 資源探索層 結論 – 理想的學術資源探索服務要件
簡介
簡介 整體館藏購置經費高漲,電子資源的漲幅尤甚 使用者習慣以搜尋引擎作為尋找資訊的入口(portal) 一站式服務 (One Stop Service) – 單一系統中擁有海量且多元的資訊 簡易的檢索介面 準確的相關排序 可取得海量、品質 不一的全文
電子資源整合查詢 Metasearch, parallel search, federated search, broadcast search, cross-database search, search portal Allows search and retrieval to cross multiple databases, sources, platforms at once MetaLib, Muse… Unified UI Electronic Resource 1 Electronic Resource 2 Broker/Agent/Value-added Service Electronic Resource 3
關於電子資源整合查詢的抱怨 複雜的介面 系統回憶時間慢 (甚至 connection timeout) – 即時分散式檢索 相關排序機制不佳 究竟哪些電子資源是可以被整合查詢的? 可同時查找的最多電子資源數量 系統回憶時間慢 (甚至 connection timeout) – 即時分散式檢索 相關排序機制不佳 去除重複機制不佳
資源探索服務 Web-Scale Discovery (WSD) Service Google(-scholar)-like one-stop service, simple search (discovery) interface, excellent relevance ranking, effective information delivery 兩項重要的特性 預先獲取的聯合索引(Pre-harvested central index) 資源探索層(Discovery layer)
資源探索服務產品 Innovative Interfaces Encore Synergy EBSCO Discovery Services Ex Libris Primo Central OCLC WorldCat Local Serials Solution Summon 超星中文學術搜索
展示
聯合索引
預先獲取的聯合索引 資源探索服務廠商週期性地從許多資訊來源擷取後設資料和全文,將其正規化(normalization)為一致的格式後匯入聯合索引,並採用資訊檢索技術建置索引(indexing) 電子資源的聯合目錄 聯合索引構成使用者在資源探索服務中所能查找的內容 集中式搜尋,避免電子資源整合查詢系統速度慢、去除重複、相關排序不易的缺點 聯合索引的資料來源 圖書館的本地資源 (Local collection) 非圖書館本地(全域)的資源 (Global resources)
聯合索引 Physical Holdings (ILS) Institutional Repository (IR) A&I DB Citation DB E-Journals E-Books DA IR Digital Archives (DA) Lib Collections … Various CMSs Local collection Global resources Pre-harvested central Index
聯合索引的資料來源 圖書館提供的資料編目資料豐富性影響搜尋 開放取用系統的資料 出版者後設資料(Metadata)及全文 MARC records from ILS Metadata records from IRs, DAs, and CMSs 開放取用系統的資料 arXiv.org, e-Prints, Hindawi Publishing, DOAJ 出版者後設資料(Metadata)及全文 資源探索服務取得授權的資料 圖書館和資源探索服務皆取得授權的資料 找廠商給貴館一份涵蓋清單 (Hoeppner, 2012)
聯合索引中的後設資料與全文 後設資料的種類 後設資料的豐富程度 MARC, Dublin core, EAD… Generic XML 引用後設資料(Citation metadata): identifier, contributor, title, date, edition, place published, publisher, URL, context Subject descriptors (Author-supplied) keywords and abstracts Full text Full texts are used for (full-text) indexing/search
comparative study proverbs' characteristics mesopotamian
影響讀者所能取得內容的因素 聯合索引中所涵蓋之前述五類內容的資料量 有多少圖書館所訂購電子資源的廠商已經和資源探索服務廠商已簽訂合作協議 圖書館希望她的使用者能夠看到多少資料(圖書館希望讀者能探索到並未訂購的內容嗎?) 不容易傳遞? 可以運用OpenURL LinkResolver連結到文獻傳遞服務,以達成傳遞任務? (Hoeppner, 2012)
Watch Out! Coverage! 內容涵蓋範圍 A WSD vendor may claim its contents covering X% of the contents in Y database The WSD vendor may negotiate with a publisher directly to license the publisher’s contents Do you appreciate the value-added process conducted by the vendor of Y? Levels of metadata So… can MY library cancel Y? Some WSD service may recommend databases according to a user’s query
資源探索層
資源探索層 舉凡各種圖書館資訊系統(library information system)的使用者介面皆可稱之為資源探索層 WSD資源探索層所具備的功能 檢索:簡易(Google-like)檢索與進階檢索 檢索限制或層面瀏覽 相關排序 顯示與傳遞 使用者介面客製化 個人化與社群服務
檢索 檢索欄位 布林邏輯、關係邏輯、切截、萬用字元 包含、相等、起始 片語、相鄰、停用字 拼字建議 Search box與圖書館網站、主題資源指引等系統的結合 與電子資源整合查詢系統的串聯
Google-like 簡易檢索
進階檢索
視覺化檢索
干整合查詢系統甚麼事? Local collection Physical Holdings (ILS) Institutional Repository (IR) Digital Archives (DA) Various CMSs E-Journals Citation DB E-Books A&I DB DA IR Lib Collections … Global resources Pre-harvested central Index
與整合查詢系統串聯 整合查詢系統的計價策略是否隨著資源探索系統的推出而調整?
結果顯示 簡目/詳目顯示 檢索詞彙鮮明標示 根據資料類型(如圖書、期刊、報紙)提供圖像 可顯示資料封面圖像(如書封) 以特殊方式標明可線上取得全文的資料 根據不同資料類型,呈現不同後設資料 與自動化系統整合 可線上取得全文的資料,使用者可直接下載或透過OpenURL Link Resolver機制取得全文 連結其他資料來源或推薦
與自動化系統整合
檢索歷史 使用者可檢視當次使用(session)的檢索歷史 (檢視檢索策略) 使用者可運用布林邏輯合併檢索多個檢索策略 使用者可針對單一檢索策略進行修正 使用者可於登入後儲存檢索策略 使用者可為檢索策略建立新知通報或RSS訂閱服務
結果輸出 使用者可於單筆或多筆檢索結果畫面,選擇輸出紀錄 使用者可利用購物車機制儲存檢索結果 使用者可選擇將檢索結果或存放於購物車內的資料以列印、電子郵件傳遞、儲存檔案、儲存至書目管理軟體、儲存成引用格式等方式輸出 支援EndNote、Refworks、BibTex、ProCite等書目管理軟體 支援APA、MLA、Chicago等引用格式 提供個別資料的永久連結(persistent link) 使用者可針對單筆或多筆資料撰寫個人筆記或註解
檢索歷史與結果輸出
檢索限制或層面瀏覽
檢索限制或層面瀏覽(續) 可否自訂Facet Category? 可否自訂Facet Items? Facet Category & Facet Items到底是怎麼來的?是否所有資源的欄位都可以Map到?
相關排序 使用者檢索關鍵字在資料中出現的次數以及該關鍵字在聯合索引中的重要性(ex. TF*IDF) 檢索關鍵字出現在重要後設資料欄位的情形 Term frequency * Inverse Document Frequency 檢索關鍵字出現在重要後設資料欄位的情形 若有多個檢索關鍵字,則將這些檢索關鍵字在資料中的相鄰程度納入考量 資料的新穎程度 根據資料類型採用特定的相關排序 提高圖書館所提供資料的權重 是否允許圖書館調整各種影響相關排序因素(欄位)的權重
使用者介面客製化 內建多種畫面模板,提供圖書館依照各自需求選用 畫面彈性可修改,採區塊方式,每區塊可放入不同類型資訊,並可設定該區塊畫面位置、出現與否與畫面內部資訊 色彩配置 可針對不同讀者群設定不同介面 提供API或Web Service進行使用者介面客製化 具備Widget開發機制 對於加值內容(如Google Books預覽、Amazon內容資訊)可以鏈結或直接內嵌於系統內呈現
使用者介面客製化(續)
個人化服務 與圖書館既有認證機制結合 (EzProxy, LDAP, ILS…) 個人化版面配置 檢索策略與檢索結果儲存 新知通告服務 (SDI) 與圖書館自動化系統的個人化服務整合
社群服務 評論 (Review / comment) 社會標記 (Tagging) 透過社群媒體分享 (Facebook, Twitter) 透過社會性標籤軟體分享 (Delicious, Connotea)
使用者認證與結果顯示
使用者認證與結果顯示 (續)
與自動化系統的個人化機制整合
結論 – 理想的學術資源探索服務要件
聯合索引 聯合索引內容與圖書館訂購內容的契合度 聯合索引內容的更新頻率 資源探索服務廠商和出版者與集成商的合作協議簽署情形 後設資料的豐富程度與一致性 納入圖書館本身提供資料的容易程度 聯合索引納入之中文資源種類與數量
資源探索層 簡單而易用的檢索介面 檢索結果的品質(如相關排序的準確程度) 檢索與相關排序設定的客製化 針對特定主題領域檢索 相關排序可考量圖書館需求 檢索限制或層面瀏覽等檢索結果導航機制 與圖書館(或母機構)現有系統的整合性(如與圖書館自動化系統、數位學習平臺的整合) 支援新興使用環境(如行動載具、社群網站等))
與圖書館需求符合的程度 系統導入的容易程度 與現有軟體和內容的相容性 廠商對顧客需求與問題的回應速度 廠商對系統的中長程開發計畫 廠商整體評價
計價與建置模式 採用買斷或租賃模式 採用本地建置或雲端SaaS服務模式 計價模式所考量的因素(如FTE人數、圖書館提供資料的筆數等) 每年需支付的維護(買斷模式)或租賃費用
Reference ARL (n.d.). Electronic Resources and Materials Expenditures in ARL University Libraries, 1992-2010. Retrieved from http://www.arl.org/bm~doc/t7_emat_intro.xls. ANDS(n.d.). Citation of datasets and collections. Retrieved from http://ands.org.au/guides/cpguide/cpgcitation.html. Breeding, M. (2011). Automation marketplace 2011: The new frontier. Library Journal, 136(6). Retrieved rom http://www.libraryjournal.com/lj/home/889533-264/automation_marketplace_2011_the_new.html.csp. Daniel, J. & Roth, P. (2012). Incorporating Millennium catalog records into Serials Solutions' Summon. Technical Services Quarterly, 29, 193-199. Gross, J. & Sheridan, L. (2011). Web scale discovery: the user experience. New Library World, 12(5/6), 236-247. Hoeppner, A. (2012). The ins and outs of evaluating Web-scale discovery services. Computers in Libraries, 32(3), 6-10, 38-40. Luther, J. & Kelly, M. C. (2011). The next generation of discovery. Library Journal, 136(5), 66-71. Retrieved from http://www.libraryjournal.com/lj/home/889250-264/the_next_generation_of_discovery.html.csp. Manning, C. D., Raghavan, P., and Schutze, H. (2008). Introduction to Information Retrieval. Cambridge University Press. Miller, P. (2006). Library 2.0: The challenge of disruptive innovation. Retrieved from http://cmapspublic2.ihmc.us/rid=1211299379745_1806224281_20373/447_Library_2_prf1.pdf OCLC (2005). Perceptions of library and information resources. Retrieved from http://www.oclc.org/reports/pdfs/Percept_all.pdf. Vaughan, J. (2011). Web scale discovery services. Library Technology Reports, 47(1). 柯皓仁(2011)。圖書館自動化與數位化—綜述。中華民國一百年圖書館年鑑。頁157-164。 黃明居(2011)。圖書館自動化與數位化—次世代圖書館館藏整合查詢系統。中華民國一百年圖書館年鑑。頁164-166。 黃鴻珠(2011)。大專校院圖書館—綜述。中華民國一百年圖書館年鑑。頁95-108。 麥綺雯(2012)。如何挑選合適的探索工具—香港教育學院圖書館的經驗分享。2012年第十一屆海峽兩岸圖書資訊學學術 研討會論文集A輯(頁295-306)。