分類目錄 搜尋引擎 整合式搜尋引擎 網路資源指南 網路搜尋技巧 評估網頁品質的方式 網路檢索工具 分類目錄 搜尋引擎 整合式搜尋引擎 網路資源指南 網路搜尋技巧 評估網頁品質的方式 參考資料1、2
網路資訊特性 幾個現象 利用網路時,請切記不要假定 人人可「出版」資訊 永遠沒有所有網站的完整清單 沒有權威官方組織、整理和評估的單位 網路不斷在變,新網站不斷出現,舊網站也不斷消失 沒有「最好」的搜尋工具 利用網路時,請切記不要假定 可更快找到資訊 可找到更新的資訊 可找到更可靠的資訊
網路檢索工具 檢索工具基本可分為四大類 分類目錄 搜尋引擎 整合式搜尋引擎 網路指南
分類目錄v.s.搜尋引擎—1/2 項目 分類目錄 搜尋引擎 資料蒐集方式 利用登錄、電腦輔助蒐集網站資料 人工分類 人工撰寫或自動摘要提供網站說明 機器人自動搜尋分析整理網頁資料 製成索引資料庫 自動摘要提供網站說明 資訊品質 一致 良莠不一 查詢方式 約略知道主題類別,即可依分類層次找到所需資訊 亦可用關鍵字查詢 需確知關鍵字或片語及其關係,方能精確找到資料 查詢結果 網站 資料品質高,數量在可控制範圍,瀏覽挑選相關資料 網頁 資料品質難控制,資料數量龐大到無法控制,難以瀏覽挑選
分類目錄v.s.搜尋引擎—2/2 項目 分類目錄 搜尋引擎 適用情況 想要對某一主題有概要性瞭解 沒有確切的資訊需求只是定期瀏覽 新知 希望找到人工篩選的優值網站 e.g. British literature、Space exploration 所要尋找資料已有明確定義,能以關鍵字或片語的組合來描述 希望能從各種不同來源搜尋完整資訊 e.g. Charles Dickens、Mars Pathfinder 代表網站 Yahoo—分類目錄的代表 台灣雅虎 Argus Clearinghouse Britannica Internet Guide 蕃薯藤 Alta Vista—網頁全文檢索始祖 Excite Google HotBot Lycos Northern Light Openfind
分類目錄 評估分類目錄優劣的項目 分類架構 分類層次 交互參照 內容摘要 以中文入口網站之分類為例 Yahoo奇摩分類 蕃薯藤搜尋目錄
搜尋引擎概說 搜尋引擎查詢的方式 建議使用適用時機 關鍵字搜尋(keyword search) 概念式搜尋(concept search) 網頁分類目錄 相關查詢(Related Searches) 相似網頁(Find Similar) 結果再查詢(Search Within) 建議使用適用時機 所要查詢的資料非常明確時,建議先利用概念式搜尋找到相關的資料,再利用關鍵字索引做廣泛的搜尋 如果所要查詢的資料不太容易界定歸類,建議直接利用關鍵字搜尋引擎,但是最好能儘量將相關的關鍵字一一輸入查詢,才能得到較完整適用的資料。
常見搜尋引擎—中文 雅虎奇摩 (http://tw.yahoo.com) 蕃薯藤 (http://www.yam.com/) Google台灣(http://www.google.com.tw/) Coo臺灣索引 (http://www.coo.com.tw/) 蓋世(GAIS) (http://gais.cs.ccu.edu.tw/) HiNet(http://www.hinet.net) Seednet (http://www.seed.net.tw) PC Home Online (http://www.pchome.com.tw/) 華淵新浪網 (http://www.sina.com.tw/) 中國指南HyperC(http://chinavista.com/hyper-c/b5hyper-c.html) 盛世網站導航(http://gbj.grchina.net/qiang/i/indexb.htm)
常見搜尋引擎—英文 Alta Vista (http://www.altavista.com/) Excite (http://www.excite.com/ ) FAST (http://www.alltheweb.com/) Go (Infoseek) (http://www.go.com/) Google (http://www.google.com/) Over True (GoTo) (http://www.overture.com/) HotBot (http://hotbot.lycos.com/) Lycos (http://www.lycos.com/) Northern Light (http://www.northernlight.com/) WebCrawler (http://www.webcrawler.com/info.wbcrwl/)
整合型搜尋引擎—Meta Search 適用時機 注意事項 ProFusion 查找冷僻的關鍵字 查看網路上有無特定主題的資訊 查詢策略盡量簡單 查看各整合工具所涵蓋的搜尋引擎數量 Dogpile 提供單一介面,同時檢索現今最普遍被使用的知名搜尋引擎 http://www.dogpile.com/ ProFusion 可同時提供檢索近1000種檢索工具 http://www.profusion.com/
搜尋引擎指南 Virtual Search Engines http://www.virtualfreesites.com/search.html 列舉超過1,000 種各式搜尋引擎 Search Engine Watch http://www.searchenginewatch.com/ 提供搜尋引擎介紹、測試、選購分析說明 Search the Internet :Three Powerful Search Approaches http://www.lib.berkeley.edu/Help/search.html University at Albany Libraries Internet Tutorials http://library.albany.edu/internet/ 中文搜尋引擎指引 http://lib.tmtc.edu.tw/resource/searchE.htm 搜索引擎蒐集 http://www.tec.org.tw/net-serv/
網路資源指南的指南(Meta Index) 列出所有資源指南及檢索工具,有助於選擇適切工具 The Argus Clearinghouse http://www.clearinghouse.net/ January 23, 2002 宣布不再更新資料,轉介建議使用Internet Public Library(http://www.ipl.org) Data Sources Classified by Type of Service 以主題和機關組織別區分 http://www.w3.org/History/19921103-hypertext/hypertext/DataSources/ByAccess.html Internet Resources Meta-Index (National Center for Supercomputing Applications) http://archive.ncsa.uiuc.edu/SDG/Software/Mosaic/MetaIndex.html The WWW virtual Library http://vlib.org/Overview.html World Web Index (Neuroscience on the Internet) http://www.neuroguide.com/wwwindx.html
地區式或機構式的資源指南 台灣學術網路(台灣大學) 台灣網路資訊中心(TWNIC) 電子化政府入口網 http://www.ntu.edu.tw/new-version/chinese/tanet.html 台灣網路資訊中心(TWNIC) http://www.twnic.net/ 電子化政府入口網 http://www.gov.tw/ World Wide Web Consortium http://www.w3.org/
主題式的資源指南 一般常見的搜尋引擎均有提供以主題分類瀏覽的功能 目前許多受歡迎的入口網站(Portal),都有提供詳善的分類瀏覽 缺點:類別不易辨識
成功搜尋的關鍵 選定能代表搜尋主題或概念的適當關鍵字 5W 分析查詢問題 把焦點放在名詞上 同義字 片語 三個恰恰好,五個不算多
網路查詢策略 明確字詞精確結果 有加有減結果更相關 加上引號關係更親密 電影 v.s. 電影,科幻 歌詞v.s. 周杰倫,歌詞 +劉德華 +梁朝偉 劉德華 –梁朝偉 加上引號關係更親密 “中國圖書館學會”
進階搜尋技巧--1 部分符合(OR) 完全符合(AND) 標題查詢 布林查詢 Alta Vista等預設部分符合 Google等預設完全符合 title:internet marketing title:” internet marketing” 布林查詢 AND Dogs and cats OR 綠島 or 蘭嶼 NOT 台灣 not 臺北
進階搜尋技巧--2 切截查詢—利用萬用字元 近似查詢 模糊查詢 大小寫相異 限定範圍查詢 欄位查詢 同音 bank* 容錯 資*策*會 Knowledge NEAR management George NEAR/2 Bush 模糊查詢 同音 容錯 大小寫相異 限定範圍查詢 語文、日期、分類、地域、網站類型、網域名稱、資料類型 欄位查詢
再次查詢 修正查詢策略 收斂查詢(Sub-Searching) 完全不符合 資料很多,但相關很少 網頁分類目錄 縮小查詢範圍 限制標題、日期 利用NOT ‘-’ 資料很少,但很符合 擴大查詢範圍 利用OR 改用分類目錄 收斂查詢(Sub-Searching) 網頁分類目錄 相關查詢(Related Searches) 相似網頁(Find Similar) 結果再查詢(Search Within)
網路檢索步驟--1 擬定策略 釐清主題 分析資訊需求 慎選搜尋工具 收斂檢索策略 利用切截 明確字詞 善用片語 利用+ - 利用個人化功能 檢查結果 進階查詢 瀏覽前幾筆 善用AND或+ 同義字 不同拼法 利用切截 明確字詞 善用片語 利用+ - 利用個人化功能
網路檢索步驟--2 強化查詢結果 評估網路資源 善用站內檢索 依循URL找到符合的網站 變化URL 儲存查詢策略 評估網路資訊品質 作者、內容、版權宣示、聯絡方式、資料新穎性、參考書目、設計和穩定性 參考專業網站評估
查詢結果的呈現 相關性排序 直接點閱(Direct Hit/ Popularity Ranking) 直接到達(Real Names Results) 群組結果(Results Clustering) 顯示筆數 顯示方式 檔案大小 顯示日期 依日期排序 頁庫存檔(Spidered Version)
評估網頁資訊品質 Robert Harris的CARS!準則 C:Credibility權威 A:Accuracy正確 R:Reasonableness合理 S:Support佐證
Credibility權威 判斷方向 可判斷為品質優良者 要小心注意者 網頁作者是誰? 作者的資歷如何? 能否查證作者的資歷?有沒有可能是偽造? 作者有沒有提供聯絡資訊 網站建置者是誰? 可判斷為品質優良者 是法定組織機構網站所提供的資訊 有編輯審查或同僚審查的電子期刊 從有嚴謹品質的圖書或期刊所轉貼的資訊 要小心注意者 匿名 錯字連篇
Accuracy正確 正確性可能有問題者 作者為什麼要建置這個網頁? 網頁沒有標明日期 這個網頁設定的對象是誰? 論述模糊或太過空泛 查看「About Us」 這個網頁設定的對象是誰? 對象是一般人?學術研究人員?小朋友?特定狂熱份子? 是容易閱讀?還是很費力?有無學科背景之需要? 網頁設計風格是樸素還是花俏? 時效性如何? 查看建置日期和最新更新日期 正確性可能有問題者 網頁沒有標明日期 論述模糊或太過空泛 資訊陳舊過時 只呈現單一觀點而忽略對立或其他多元觀點
Reasonableness合理 公正性 客觀性 適當性 一致性 世界觀 缺乏合理性者 論調是否公正、平衡、理性?還是流於情緒? 有無利益衝突在內? 客觀性 查看「有」和「沒有 」提供的資訊是哪些? 是否完整引用或斷章取義? 適當性 所提供資訊,在現實世界是否可能出現? 廣告和所要提供的訊息是否有明顯區隔? 一致性 世界觀 缺乏合理性者 惡言粗語 過份鋪陳 誇張重要性 利益衝突
Support佐證 作者有沒有提供支持其論述的資訊 所提供的證據資訊是否可信? 建議 提供參考書目 所引用的網頁是否為大眾熟知或具有權威性? 所引用的網頁,是否也有註明資料來源?同樣主題的其他網頁是否引用相同資料? 建議 如果難以判斷,請存疑,勿隨便使用
Google檢索練習 請試著在Google檢索列輸入下列檢索詞彙,看看找到什麼樣的資料? 企管 site:www.fju.edu.tw inurl:mp3 挪威森林 intext:mp3 挪威森林 intitle:mp3 挪威森林 site:com.tw filetype:swf 阿貴 link:www.lib.fju.edu.tw related:www.lib.fju.edu.tw