Web citation Availability: A Follow-up study 圖資所 碩一 李珮寧 R98126002 圖資所 碩一 謝宜瑾 R98126003 圖資所 碩一 李書萍 R98126006 2009/12/10
大綱 研究背景 研究方法 研究目標 文獻回顧 研究結果 結語 研究討論 2009/12/10
研究背景1/3 Citation: What is new? What is already known? 2009/12/10
研究背景2/3 Original Study(2002/1~2002/7) 調查來源:1999~2000,34本圖資期刊, 出版文章中的500筆citation 研究目標:瞭解citation特性與可得性的 關係 研究結果: 大部分的參考文獻(citation)只有部分書目且不包含檢索日期 大部分的URLs指向.edu和.org網域,但不包含其下的分頁(tilde~) 2009/12/10
研究背景3/3 超過56.4%原始URL可被找到 81.4%可在網際網路中查詢到 89.2%可在internet archive取得 與available有關的因素: Citation內容(content) 目錄層次(directory) First level vs. Depth level →越上層的越容易取得 網域(domain):edu、gov、org、com 僅有少數期刊提供引用電子資源的instruction 2009/12/10
研究方法 2009/12/10
研究方法 由於是follow-up study,因此資料延續 original study的data,檢驗2005.8~2006.6間, 500筆web citation 的URL狀況。 主要使用Pearson chi-square(SPSS 14) p<.05為顯著水準 URL Web Archive Archive:Wayback machine 2009/12/10
研究目標 2009/12/10
研究目標 觀察URL persistent的變化 瞭解1999~2000之間,被引用的網頁內容 的可取得性(available) 期刊提供給作者關於引用網路資源的 instruction 2009/12/10
文獻回顧 2009/12/10
文獻回顧 Persistence of Web Pages 作者 內容 時間 排序 Sellitto, C. 123 papers from AusWeb conference series, 2168 references cited 1995-2003 50%的citation是引用網路資源,其中45.8%的連結已失效,平均半衰期為4.8年。 Markwell & Brooks Biochemistry and molecular biology Web-based educational materials 2000-2002 515個網站中超過 20%網頁內容改變、連結失效等 Dellavalle 3 high-impact scientific journals (NEJM, JAMA, Science) 2001-2003 Inactive reference JAMA-21% Science-11% Wren Dermatology journals 2004 Availability 2004年:81.7% 1999年:65.4% 2009/12/10
文獻回顧 Factors Related to Persistence 作者 內容 時間 排序 Sellitto, C. 123 papers from AusWeb conference series, 2168 references cited 1995-2003 遺失程度 .edu>.com Markwell & Brooks Biochemistry and molecular biology Web-based educational materials 2000-2002 穩定度 .gov>.org>.edu>.com Dellavalle 3 high-impact scientific journals (NEJM, JAMA, Science) 2001-2003 活躍度 .org>.gov>.edu>.com Wren Dermatology journals 2004 Availability .edu>.org>.net>.com> .gov Factors related to persistence Directory depth(分頁深度) Domain(網域) 2009/12/10
研究結果 2009/12/10
研究結果 URL persistence:下降17.4% 下 降 2009/12/10
研究結果 Web search: 用Google搜尋到的URL比original study多 找不到的比例增加 2009/12/10
14% more than original study 研究結果 Internet Archive:use Wayback Machine 14% more than original study Wayback machine只接受URL 2009/12/10
研究結果 URL種類改變 原本以為URL的變化是: Persistent Available Not found 結果是…. Accessible Persistent Not found Available Available Not found 1.有可能在study1連結沒有work,在follow-up有work 2.由於網站提供更多工具,如自動重新引導,因此可得性提高 Study1:有12個網路引文原本是URL not available,因此等一個禮拜後再檢索一次。其中三個在web找到,而非原先的URL。而在follow-up中,這些連結直接導引至有其內容的網站。 其中九筆在study1中等一個禮拜後還是找不到,但在follow-up裡,找得到內容,只是不是原先的URL,也不是轉介至相關網站。 顯示網路資源的特性:不斷變動 2009/12/10
研究結果 提到original study中原本可在archive裡找到的344筆參考資源,在follow up研究中卻變成有50筆找不到 文章中(p.47右上角)提到original study中原本可在archive裡找到的344筆參考資源,在follow up研究中又變成有50筆找不到(not found in archive) original study中原本可在archive裡有146筆參考資源找不到,在follow up研究時有46筆被找到了 2009/12/10
研究結果-Availability的特性 卡方檢定(請見下頁圖) 自變項 Citation content Domain:original domain、implied domain URL directory depth Source journal Page type 只留下面的檢定的自變項? 2009/12/10
卡方檢定結果 Report 在original study顯著,在follow-up不顯著的地方 follow-up想檢驗的source journal 跟page type在URL均有達到顯著。表示這兩個因素會影響availability. 3. 紅色框:要比較的部分;黃色框:follow-up要檢定的項目有顯著的部分;藍色框:要解釋嗎? DNA: 在archive內只能夠比對URL,因此無法查得其他網際網路內的資源 原先在original study具顯著差異的citation content和implied domain在follow-up study則不顯著 2009/12/10
卡方檢定結果-follow-up URL Follow-up 在URL內有顯著的,特別比較引用期刊的來源,如果是紙本的期刊那變動性較小 另外如page type, 2009/12/10
卡方檢定結果-follow-up Web 第一個框:書目資料越詳細,越穩定 第二個框:edu、gov、org比com穩定 2009/12/10
卡方檢定結果-follow-up Archive 雖然有顯著差異,但其實每個類項都差不多 2009/12/10
Instruction for authors Original study 6/34的出版社有告知作者如何引用網路資源 →3/6進一步指導 教導使用APA 教導使用芝加哥格式14版 (未包含網路資源的引用) 2009/12/10
Instruction for authors Follow-up study 2/34停止出刊,2/34合併(34-2-1=31) 12/31指導作者如何引用網路資源 教導使用芝加哥格式14版 教導使用芝加哥格式15版 (教導如何引用網路資源) 要求要用數位物件識別號 (Digital Object Identifier,簡稱DOI) 會告知作者網路的不穩定性 2009/12/10
結語 Directory depth是persistent的關鍵 depth越深,persistent越低,但非線性關係 Navigation type vs. content type Print journal vs. 電子期刊 Domain:.edu、.gov、.org>>>.com More persistent 1.第四層的persistent是43.8%,第一層是40.3%,顯示上有其他因素影響。 More persistent 2009/12/10
研究討論 內文多為report表格數字 各因素之間彼此是否有影響? 卡方檢定,原先在Original Study顯著的 citation content與implied domain在follow-up 未顯著,作者沒有進一步解釋原因為何? 期刊出版社提供給作者關於引用網路資源 的instruction其影響為何? 2009/12/10
2009/12/10