Google 自訂搜尋 淡江大學資訊中心 專案發展組 朱家璁 2009/10/6
本次課程的三個部分 第一階段 第二階段 第三階段 介紹Google自訂搜尋 打造我的Google自訂搜尋
第一階段 介紹Google自訂搜尋
為何使用Google自訂搜尋? Google目前為最多人使用的搜尋引擎 了解網站被Google搜尋的狀況與熱門度 提升網站在搜尋引擎上的排名! 容易設定、容易維護 不需為了要有站內搜尋功能, 自己來開發、購買、維護搜尋引擎
甚麼是Google自訂搜尋? Google Co-op Custom Search Engine (簡稱Google CSE) 快速簡單的打造自己的搜索引擎 網址: http://www.google.com/cse/ Google依照我們事先設定在自訂搜尋中的網址及條件作為資料庫,根據使用者給的關鍵字來檢索列出 下列資料可能無法搜尋到 失去連結的網頁 資料庫中的資料 動態網頁、被轉址或無固定網址的網頁 多媒體特效網頁
Google CSE 的特色 對個人使用者而言: 對網站、部落格擁有者而言: 它可讓你去「蒐集」各種網路上的網站,然後快速打造出一個「特別適合你自己」的搜尋引擎 操作方式簡單又強大 對網站、部落格擁有者而言: 增加服務,提供站內搜尋、客製化&特色的搜尋引擎 不需額外購買搜尋引擎,節省花費與開發時間 降低網站的負荷 簡單且快速設定完成後,日後不需維護
適合有「站內搜尋引擎」的網站 適合: 不適合: 入口網站、代表網站 文件資源豐富的網站 開放訪客流覽的討論區或留言版 大量文章的部落格等 規模小或內容少的網站 需身分認證才可瀏覽的網站 純動畫特效的網站等
搜尋引擎原理及概念 由搜尋網站定期派出搜尋程式(Spider/Robot)自動搜尋網頁 透過編目程式自動建立索引 根據所搜尋到網頁中的超連結再搜尋下去 (遞迴的觀念) 通常會把整個網頁抓回來 透過編目程式自動建立索引 透過排序程式建立優先順序 (網頁的分數) 被連結數多 / 點閱率高 / 符合搜尋條件程度高 / 參考價值高 / 網頁質量高 / 更新率高 / 有付費 等優先
第二階段 打造我的Google自訂搜尋
開始打造我的搜尋引擎 分標準版與企業版:標準版為免費, 搜尋結果網頁會顯示廣告, 但非營利組織、大學、政府機構可不顯示廣告;企業版每年$100美元, 搜尋結果網頁不顯示廣告。 (1)註冊自己的Google帳戶,已有Google帳戶者不需再註冊。 https://www.google.com/accounts/NewAccount?continue=http%3A%2F%2Fwww.google.com%2Fcoop%2Fmanage%2Fcse%2F&hl=zh-TW&service=cprose (2)帳號申請完成會收到一封認證信, 點選信件中的啟用連結。 (3)登入Google帳戶後, 開始申請自訂搜尋引擎。
註冊Google帳戶並啟用自訂搜尋
收到認證信,點選驗證連結
進入CSE首頁 http://www.google.com/cse/
新的搜尋引擎 (畫面太長分成兩頁)
設定時的重點: 選取一些網站 「你想要搜尋什麼?」 「選取一些網站」是重頭戲 可讓搜尋引擎檢索「僅我選取的網站」 希望讓範圍擴大則可以選擇「整個網路,但將重點放我選取的網站」,這樣加入的網站列表的結果會被排前。 也可以搜索到整個網路上的內容。 「選取一些網站」是重頭戲 在這邊加入欲檢索的網站網址 「把網址輸入」,用「Enter換行」 有疑惑可以按旁邊的「格式化URL的秘訣」查看 運用「*」星號來達到彈性的設計
填寫完各欄位資料, 點選「完成」
進行細部設定 我的搜尋引擎 – 控制台 http://www.google.com/cse/manage/all 請將上述連結加入到我的最愛,日後修改用的到!
控制台進行細部設定 控制台有13項設定可供細部調整 依照自己需求自行客製化 切換到「取得程式碼」 將Code複製下來 將程式碼貼到首頁<HTML>欲加入搜尋引擎的位置 測試!
找出「程式碼」
範例: 淡江大學資訊中心
以Iframe方式嵌入資訊中心首頁 <iframe frameborder='0' src='search_ipc.htm' width='215' height='30' title="校內網頁搜尋(另開新視窗)" > </iframe>
search_ipc.htm 程式碼如下: <html> <head> <meta http-equiv="content-type" content="text/html; charset=big5"> <title>淡江大學資訊中心</title> </head> <body topmargin="0" leftmargin="0" bgcolor="#FFF6F6"> <form action="http://www.google.com/cse" id="cse-search-box" target="blank"> <div> <input type="hidden" name="cx" value="008699758040604978479:o29k--niacs" /> <input type="hidden" name="ie" value="big5" /> <input type="text" name="q" size="16" /> <input type="submit" name="sa" value="站內搜尋" style="font-size:12;" /> </div> </form> <script type=“text/javascript“ src="http://www.google.com/coop/cse/brand?form=cse-search-box&lang=zh-Hant"> </script> </body> </html>
第三階段 Google自訂搜尋 控制台的細部設定
控制台 - 基本資訊 - 搜尋引擎關鍵字 輸入符合網站主題的關鍵字 符合關鍵字的資料將於查詢結果中動態排前 多個關鍵字可用「空格」隔開,第一個關鍵字的比重會最高;也可用「“ ”」來包住特定的詞組。
控制台 – 網站 設定要檢索或排除的網站連結 點選新增網站按鈕→輸入網址 (運用「*」星號彈性設計)
加入新檢索網站的各種方法 加入位址包含此 URL 的所有網頁 只包括這特定網頁,或我輸入的 URL 模式 →搜尋整個網站 只包括這特定網頁,或我輸入的 URL 模式 →只搜尋符合這個網址的特定網頁 上一項 ipc.tku.edu.tw/new = 本項 ipc.tku.edu.tw/new/* 動態擷取此網頁上的連結並將它們新增到我的搜尋引擎 包含此網頁連結的所有網頁 包含此網頁連結的所有部分網站 包含此網頁連結的所有網站 → 「動態擷取」能把網頁裡出現的連結全部都自動加入你的搜尋引擎中,也就是說加入一個網站後可以同時獲得十幾個網站進入你的搜尋系統。
控制台 – 建立索引 建議由網站管理者進行設定 使用「 網站管理者工具」來維護 https://www.google.com/webmasters/tools/ 把網站的Sitemap提交給Google搜尋 Google會進行審核,不一定會跑完整個Sitemap 使用純文字或XML格式,約三到五天後開始搜尋
控制台 – 限制條件 「限制條件」就像一個分類,讓想要專門搜索某個分類時可以快速的切換。搜尋結果會將符合分類的項目優先排序。
「置頂查詢」提供手動輸入查詢結果,並將之於查詢結果中優先排列置頂秀出。 控制台 – 置頂查詢
控制台 – 外觀與風格 自訂搜尋引擎與檢索結果的外觀、配色
控制台 – 程式碼 除了在 Google 網頁上代管結果之外,另有iframe或覆疊(Custom Search Element / AJAX)模式。
控制台 – 協同作業 設定要讓哪些人可以和你「一起編修」這個搜尋引擎
控制台 – 統計資料
補充: Google 標籤 將Google標記工具連結加入我的最愛
<< Q&A 討論時間 >> 報告完畢,謝謝大家。