謝寶煖 台灣大學圖書資訊學系 pnhsieh@ntu.edu.tw 2005年6月15日 台北市議會圖書館 網路資源搜尋 謝寶煖 台灣大學圖書資訊學系 pnhsieh@ntu.edu.tw 2005年6月15日
課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 搜尋學術資源 課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 Google News Alerts、GMail Google toolbar、Google Desktop Search Blogger 搜尋學術資源 Google Print Google Scholar Google Video
Google源起 Google 前身是“Backrub” 發音: 'gü-"gol 名詞 noun Google是以 googol為本玩的文字遊戲 Googol是美國數學家Edward Kasner的nephew, Milton Sirotta所造出來的字,後來因為出現在Kasner 和 James Newman的大作“Mathematics and the Imagination” 而聲名大噪。 Googol的意思是1後面加上100個0,Google用這個字來彰顯公司的使命在整理網路上龐大的、無限量的資訊。 前身是“Backrub” 1995年Stanford 大學的博士生Larry Page 和 Sergey Brin所發展的搜尋引擎 和大多數成功創業的美國大學生一樣,Google這家公司也是由車庫開始的。選擇車庫的原因是洗澡、洗衣服方便,因為當時他們的服務量就已到達10,000 searches a day Larry and Sergey 資料來源:http://www.google.com/corporate/history.html
網站數量 Netcraft Web Server Survey has topped nearly 64 million sites for June 2005 64,808,485 sites(6千4百80萬多個網站) roughly 1 million sites a month 資料來源:Netcraft Web Server Survey http://news.netcraft.com/archives/web_server_survey.html
June 2005 64,808,485 May 2005 63,532,742 March 2005 60,442,655 ( exceeded 60 million) February 2005 59,100,880 January 2005 58,194,836 December 2004 56,923,737 November 2004 56,115,015 sites October 2004 55,388,466 sites September 2004 54,407,216 sites August 2004 53,341,867 sites July 2004 52,131,889 sites June 2004 51,635,284 sites May 2004 exceeded 50 million April 2004 49,750,568 sites August 1995 18,957 hosts 網站成長量
課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 搜尋學術資源 課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 Google News Alerts、GMail Google toolbar、Google Desktop Search Blogger 搜尋學術資源 Google Print Google Scholar Google Video
網頁數量 搜尋引擎Google可以搜尋 網頁 80億5千8百零4萬
Google www.google.com www.google.com.tw 國際多語,透過語言選擇項目 用戶可以指定自己喜好的語言版本 可設定查詢範圍只在特定的語言內
I’m Feeling Lucky 好手氣 圖資電子報第20期:Google好手氣 http://www.lis.ntu.edu.tw/~pnhsieh/epapers/no20.htm
Google做什麼? 派機器人到Internet上爬行,蒐集並索引網頁資訊(Crawls and indexes) 將網頁、圖片、連結等儲存在備份伺服器(caching servers) 提供簡明的介面供使用者輸入搜尋策略搜尋備份網頁(cached pages)資料庫 以相關序呈現查詢結果(relevancy)
Server Side Client Side 資料來源:http://computer.howstuffworks.com/search-engine1.htm
如何決定相關與排序 Exact Phrase: 關鍵詞以片語形式出現? Adjacency: 關鍵詞之間的距離有多近? Weighting: 關鍵詞出現的次數? PageRank/Links: 連進來+ 有多少連結連到本網頁?(Popularity) 連進來網頁的人氣指數( Popularity ) 連出去- 本網頁有多少連結? 公式: (Exact Phrase Hit)+(AdjacencyFactor)+(Weight) * (PageRank/Links) 資料來源:Google Hacking: A Crash Course http://bss.sfsu.edu/bsscomputing/training/onthespot/alexkeller_google_hacking.pdf
網頁標題(Web Page Title)
Title Description keywords
Politics of PageRank™ Googlearchy (Hindman et. al., 2004) A few heavily-linked sites dominate political discourse on the Web Most connected sites are listed at the top of the search results, thus getting the most visitors Creates centralization/lack of diversity in viewpoints to which searchers are exposed Localized sites may display different search results than the US site http://www.princeton.edu/~mhindman/googlearchy--hindman.pdf
Google好手氣 直接連到Google最相關的網站,不顯示結果清單 輸入人名,Google自動連到官方網站 搜尋結果的第一筆 輸入人名,Google自動連到官方網站 如果他/她有建網站的話 而且網站有寫meta tag的話 試試:stephen king, terry pratchett, michael flatley 或最多人點選的網站 輸入機構組織、團體,Google自動連到官方網站 lord of the dance、總統府、white house、台大、崔媽媽、國圖 輸入一組關鍵詞 Google依然會自動連結到搜尋結果排名第一的網站 如:「知識管理」
設定使用偏好 Preference 圖資電子報第19期:強化Google搜尋能力:設定使用偏好 http://www.lis.ntu.edu.tw/~pnhsieh/epapers/no19.htm
語言選項 language tool
Globalizaiton Klingon Hacker Elmer Fudd
翻譯
Advanced Search(進階搜尋) Language Date Format :pdf, ppt Domain:. tw. edu Advanced Search(進階搜尋) Language Date Format :pdf, ppt Domain: .tw .edu.tw .edu
標題 內文 URL 連結 除去
搜尋秘笈 稱霸網林 明確關鍵詞 精確結果 關鍵詞愈明確,搜尋結果愈精確 電影 電影關鍵報告 總統就職 國宴 四季宴 電影 再見可魯 搜尋秘笈 稱霸網林 明確關鍵詞 精確結果 關鍵詞愈明確,搜尋結果愈精確 電影 電影關鍵報告 總統就職 國宴 四季宴 電影 再見可魯 2004年諾貝爾文學獎得主 ( 代表空一格,中文以空格區辨詞組)
搜尋秘笈 稱霸網林 關鍵詞怎麼選 平均輸入1.5個關鍵字 太少 google可搜80億網頁 5W1H What Who Where When 搜尋秘笈 稱霸網林 關鍵詞怎麼選 平均輸入1.5個關鍵字 太少 google可搜80億網頁 5W1H What Who Where When why How
搜尋秘笈 稱霸網林 要加不要減 結果更相關 要+ 輸入的關鍵詞一定要出現在檢索結果中 不要- 輸入的關鍵詞不可以出現在檢索結果中 臥虎藏龍 要+ 輸入的關鍵詞一定要出現在檢索結果中 臥虎藏龍 臥虎藏龍電視劇 臥虎藏龍 +電視劇 +電影 臥虎藏龍 +電視劇 +電影 -音樂 +clinton +lewinsky 不要- 輸入的關鍵詞不可以出現在檢索結果中 臥虎藏龍 -音樂 +clinton –lewinsky 知識管理 -site:.com
搜尋秘笈 稱霸網林 片語查詢加引號 Phrase Searching 專有名詞 字詞順序前後一致 搜尋秘笈 稱霸網林 片語查詢加引號 Phrase Searching “knowledge management” “再見可魯” “思考的技術” 進階搜尋:包含完整的字句 專有名詞 字詞順序前後一致 Google自動片語查詢:每次輸入都以片語形式出現,優先視為片語,例:to be or not to be
搜尋秘笈 稱霸網林 限定查詢範圍 結果更精確 語言:進階搜尋>查詢網頁語言 偏好設定 搜尋秘笈 稱霸網林 限定查詢範圍 結果更精確 語言:進階搜尋>查詢網頁語言 偏好設定 網域:只在或去除 .edu .tw .gov.tw .com .idv.tw 日期:過去3個月、6個月、一年、任何時間 檔案類型:只在或去除 .ppt .pdf .doc 分類:網頁目錄 Google Directory sport injury rehabilitation Science > Social Sciences > Psychology > Health and Sports
搜尋秘笈 稱霸網林 指定欄位(Field Searching) 進階搜尋:字詞位置 title:knowledge management 搜尋秘笈 稱霸網林 指定欄位(Field Searching) 進階搜尋:字詞位置 查詢字詞位於網頁的 標題(title) 內文 URL 連結 title:knowledge management title:“knowledge management” title:”knowledge management” –site:.com
搜尋秘笈 稱霸網林 自然語言查詢 利用智慧代理分析輸入的問句,粹取關鍵字並判斷關鍵字間的布林關係,送到搜尋引擎資料庫進行查詢比對,再回饋查詢結果。 how doctor define SARS How search engines work Where is a good place to stay in Boston? Stop words(頻繁字),如a, an, at, in, the … To be or not to be “To be or not to be” 加引號 搜尋片語
常用查詢技巧 多組關鍵詞 要 + ,表示 and 不要 -,表示not 指定檔案類型 指定欄位:標題(title) 限定日期
查詢結果 頁庫存檔 Cached 類似網頁 Similar Pages 結果再查詢 search within this result
按右鍵
翻譯網頁
翻譯網頁內容
追蹤類似網頁
搜尋特定網站
Google搜尋運算元
Google搜尋運算元 cache: 只搜尋Google所索引的備份網頁; link: 搜尋連結到特定網頁的網頁; info: 顯示關於某個網站的資訊; define: 搜尋定義; stocks: 顯示股價指數; allintitle: 顯示所搜尋的關鍵詞出現在網頁標題的網頁 例:allintitle:”Vincent van gogh”; intitle: 顯示網站標題有特定單字的網站; allinurl: 顯示所搜尋的關鍵詞出現在網頁URL的網頁; inurl: 顯示網站URL有特定單字的網站。
搜尋數字範圍
Directory
網頁目錄
Google Services
Google Labs
Google Tools
課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 搜尋學術資源 課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 Google News Alerts、GMail Google toolbar、Google Desktop Search Blogger 搜尋學術資源 Google Print Google Scholar Google Video
Evaluating Online Sources Examine the URL Who is hosting the site? Look for logos, copyright statements and the domain name (.com, .net., .edu, personal site?) Look at the page content Who wrote the page and when? Is it updated? What are the author’s credentials? Are sources referenced? Links credible? What do other people think? Google the author or use the link: feature Think about the page’s purpose Tone - ironic, polemical, humorous? Why is this information on the web – it is trying to inform, persuade or sell? Is the information peer-reviewed? Can you check the sources used? Other Web sites with information about evaluating sources: Scholarly or popular? http://library.humboldt.edu/infoservices/scholorpop.htm http://www.library.cornell.edu/olinuris/ref/research/webeval.html From: http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/Evaluate.html
課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 搜尋學術資源 課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 Google News Alerts、GMail Google toolbar、Google Desktop Search Blogger 搜尋學術資源 Google Print Google Scholar Google Video
Google Alerts
GMail (Google Mail) http://gmail.google.com Search, don't sort. Use Google search to find the exact message you want, no matter when it was sent or received. Don't throw anything away. 2000 megabytes of free storage so you'll never need to delete another message. 2 G (megabytes ) Best for alert services
http://toolbar.google.com/
Google Desktop Search
What does GDS do? GDS examines every file on your hard drive (20GB) Index tool Takes an hour on most PC’s After indexing, double click the GDS tool Just like Google.com on your personal hard drive
To Run GDS Task Tray Icon Google Search Engine
Where Google Can’t Lead You Google and other search engines (A9, Yahoo!, Altavista, Dogpile, etc.) index and search the visible Web Even Google doesn’t search the invisible Web General databases (like archives of the Library) Proprietary databases (like those costing $) Certain excluded file types/pages (Flash, movies, sound files, etc.) Script-based/dynamic pages (those using extensive programming languages to display content)
Blog Weblog Blog 網上日誌 台灣翻譯成「部落格」 中國則叫「博客」 韋氏大辭典編輯委員會選為2004年「年度之字」(word of the year) 部落格的原型誕生於1993年,原本是一種網路過濾器(filter),功能僅限挑選一些網站,並做些簡單的介紹 1994年美國Swathmore College大學生Justin Hall建立了第一個Blog 然因受限於技術,直到1999年Blog名稱正式出現時,全球也不過只有23個部落格 (Evan Williams’s Blogger ) 至今全球已經有三千一百萬個部落格(與加拿大一國人口相當) 預計到2005年底將再成長到五千三百萬個,也就是平均一天冒出四萬,當下每過一分鐘,就有28個新部落格在世界各地誕生
http://www.blogger.com
課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 搜尋學術資源 課 程 內 容 Google源起 強化Google的搜尋能力 網路資源評估 Google的搜尋工具 Google News Alerts、GMail Google toolbar、Google Desktop Search Blogger 搜尋學術資源 Google Print Google Scholar Google Video
Why use the Internet to find academic information? The Internet can be a good source of information not available in other sources: Conference papers Statistics Research in progress News stories Free online journals Images Theses Remember there is a lot of rubbish on the Internet too! Always evaluate what you find.
http://scholar.google.com
引用CI的39筆資料
全球那個圖書館有CI這本書
名字縮寫中間不空格並加引號
author:"PL Chang"
Taiwan author:"PL Chang"
About Google Scholar search specifically for scholarly literature including peer-reviewed papers, theses, books, preprints, abstracts and technical reports to find articles from a wide variety of academic publishers, professional societies, preprint repositories and universities, as well as scholarly articles available across the web English only Note: NOT all results from Google Scholar are freely available in full text on the web. Some may be available through library subscriptions (check the library catalogue and databases or ask RefServices for help)
Subject specific Engines Search engines use software programs to create lists of websites that can be searched using keywords. Each search engine varies by: the number of sources it searches the type of resources it searches general search engines: Google subject specific engines: Scirus www.google.com and www.scirus.com
Google Print
Google TV Several companies are creating TV Video Search Capabilities – Microsoft, Yahoo To build the service, the company is recording live tv shows and indexing the related closed-caption text of the programming (Library)
Searching Television Video
Searching Television Video
網路資源搜尋工具 分類目錄(subject directories) 搜尋引擎(search engines) 網站 Yahoo, Yam 搜尋引擎(search engines) 網頁 Google, Alltheweb, altavista Openfind, sina (找期刊論文) 整合式搜尋引擎(meta search engines) Mama, DogPile, Search.com 入口網站(Portal) 網站指南(Web Guide)
Thank you http://www.lis.ntu.edu.tw/~pnhsieh/