以資源共享的觀點建構數位文史工具書的方法: 以詩詞典故辭典網站為例 數位時代漢學研究資源國際研討會

Slides:



Advertisements
Similar presentations
語常一 工具書使用法與 資料檢索. 語常一 目 次 語常一 工具書使用法與資料檢索 語常一 工具書使用法與資料檢索.
Advertisements

蘇軾詩典故用語研究 第五屆漢語詞匯語意學研討會
行銷研究 單元三 次級資料的蒐集.
練習查找研究主題 使用免費網路課程教材 利用網路熱門主題
2005年文學與信息科技國際研討會 主題演講 北京大學主辦 從「不能」到「能」: 談文學數字化的研究教學與發展
陳維魁 博士 儒林圖書公司 第九章 資料抽象化 陳維魁 博士 儒林圖書公司.
教學優良教師分享 資訊管理系 陳昌助.
TQC+ JAVA全國教師研習會 PLWeb 程式設計練習平台 簡介.
亞洲大學的數位學習資源與應用 鍾仁宗老師 101年12月4日.
第一篇 Unix/Linux 操作介面 第 1 章 Unix/Linux 系統概論 第 2 章 開始使用 Unix/Linux
2-3 基本數位邏輯處理※.
電子商務基本概念 電子商務的定義 1-1 電子商務的特性 1-2 電子商務的演進 1-3.
信神圖書館影音VOD操作說明.
Endnote書目資料匯入 -西文資料庫.
ASP.NET基本設計與操作 建國科技大學 資管系 饒瑞佶 2007年.
CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:
MEDLINE with full text (EBSCO)
電子郵件 人際溝通 2018/12/27 輔仁大學圖書資訊學系.
信神圖書館影音VOD操作說明.
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
EndNote Web 2.0 ISI Web of Knowledge 金珊資訊有限公司
EBSCOhost App應用程式 安裝方式.
FTP檔案上傳下載 實務與運用.
私立南山高中 信息組 電腦研習 電腦資料的備份 中華民國 99年4月20日 星期二.
歡 迎.
大數據與我 4A 陳駿榜.
Topic Introduction—RMI
PLC-GPPW軟體使用教學 授課教師:張祖烈
本院使用建教合作之輔仁大學 圖書館資料庫 設定方式說明
古今地圖比對 國立彰化高中102年高瞻計畫空間資訊專題課程.
第 19 章 XML記憶體執行模式.
研究用資料庫 REDCap 台大醫院新竹分院 心臟內科 謝慕揚.
網路工具運用 講師:鍾詩蘋.
授課老師:楊維邦教授 組長:劉秋良 成員:李政均、郭瀚文、鄒震耀
網頁程式概論 建國科技大學資管系 饒瑞佶 2015/9 V1 2016/4 V2 2016/9 V3.
網頁資料知多少? 事 實 ? 謠言?.
EBSCO MasterFile 電子雜誌資料庫基本檢索使用教學
三年級國語生字詞語補充教學 ※「凶」、「兇」傻傻分不清楚? ※當「河馬」遇見「荷馬」 …… ※到搖頭晃腦網站「首」 「頁」 ,顧顧「自」己的面子吧! 設計者:黃鈺涵.
數位學習資料收集整理 Evernote應用
EBSCOhost EconLit with Full Text.
智 慧 型 環 境 系 統 實 驗 室 生態工程 環境評估 決策分析 人工智慧 資訊系統 永續發展
MicroSim pspice.
用國際化視野連結客戶 ACE 王耀德 Owen Y.T. Wang
資訊安全和資訊倫理宣導 永康區復興國小教務處.
電腦概論考題分析 佛學資訊組 碩一 張榮顯.
MiRanda Java Interface v1.0的使用方法
英文管理期刊導讀 A Guide on Reading International Management Journals Spring, 2007 Friday, 10:10~12:00 R9208 Instructor: 張婉菁 Phone:
編輯網頁可用那些應用程式? 記事本 Word FrontPage Dreamweaver.
師大 KSP 操作手冊.
Work with your Results and Citations
第四章 通訊與網路管理 授課老師:褚麗絹.
資料擷取與監控應用實務.
妙法寺陳呂重德紀念中學 高中課程簡介會 資訊及通訊科技.
注音符號課程綱要 注音符號應用能力 A-1-1 能正確認念、拼讀及書寫注音符號。 能熟習並認念注音符號。
介紹Saas 以Office 365為例 組員: 資工四乙何孟修 資工四乙 黃泓勝.
程式語言與邏輯:主題示範 報告人:國立台灣師大附中 李啟龍 老師 學年度資訊科技概論研習.
Netlibrary電子書 使用介紹 歐靜諳 文崗資訊股份有限公司.
連結資料庫 MYSQL.
教育類相關資料庫.
多站台網路預約系統之 AJAX即時資料更新機制
CINII操作手冊 圖21.會員可檢索資料之範圍及入境 圖1.CINII基本檢索畫面 圖22.單位別逐一檢索的畫面及操作方式
網路上免費使用的Medline PubMed-Medline.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
Discovery 數位課程教學影片資料庫
報告人: 新竹縣教育研究發展暨網路中心 辛文義.
Joining Multiple Tables
SpringerLink簡易使用說明.
Solution for Post-genomic Era
動 腦 知 識 庫 大鐸資訊股份有限公司 TudorTech Systems Co., Ltd.
CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:
Presentation transcript:

以資源共享的觀點建構數位文史工具書的方法: 以詩詞典故辭典網站為例 數位時代漢學研究資源國際研討會 以資源共享的觀點建構數位文史工具書的方法: 以詩詞典故辭典網站為例 數位時代漢學研究資源國際研討會 元智大學中語系‧羅鳳珠、蔡宛純

研究目的 圖書文獻可以分為原典文獻與工具書文獻,前者用以閱讀,後者用以參考。因為工具書文獻主要的用途在查檢資料出處,不在閱讀,所以將之數位化並提供檢索功能的需求迫切性與對使用者的方便性都比原典文獻高。 典故是寫作及解讀詩詞最大的障礙 解決詩詞典故之解讀與寫作之引用的問題 建立詩詞典故辭典網站 建立詩詞典故自動標示顯示功能

研究方法 分析典故的內容元素 分析詩人用典的方法 建構典故的描述方式與標記欄位 建構典故的知識結構與資訊表達架構 以蘇軾詩為範圍、以【詩詞典故辭典網站】為基礎 以中研院【漢籍資料庫】及元智大學【網路展書讀網站】為跨資料庫之範圍

典故的定義 一、詩詞等韻文由於受到格律之字數的限制,使用典故成為修辭的重要技巧。 二、所謂典故,一般辭書的解釋是:「詩文等作品中引用的古代故事和有來歷出處的詞語」 語典 語典指變化前人詞語,但沿用前人語意的寫法 事典 引用古代故事或某人生平事蹟以豐富內容含意的寫法 語事混合典 融合前人用過的典故之用語及同一個典故故事為內容的用法

典故的解讀與引用的困難 典故的出處,多數來自於文獻上所記載的語句與事蹟,少數來自於民俗諺語或世傳用語。 「博覽群書」、「旁徵博引」便成為詩人寫詩與讀者解讀典故的首要條件。 從「博覽群書」到能「旁徵博引」,須皓首窮經,須理解與記憶,豈是三年五載可及?如蘇軾、顧炎武者,古今有幾?

引用資訊科技解決詩詞典故問題的 能與不能 能 電腦強大的儲存、記憶、搜尋、比對的能力,可以解決「博覽群書」所需的記憶能力。 不能 只能分辨字形,不能理解語意(字形相同,語意未必相同;語意相同,字形未必相同)

引用資訊科技解決詩詞典故問題的方向 在電腦只能分辨字形,無法理解語意的侷限之下,如何使電腦從辨認字形提升到理解語意? 如何使電腦「旁徵博引」的品質更接近人腦?(使電腦能分辨典故語意) 詩人寫詩及讀者解讀詩作,如何藉助資訊科技工具的幫助,提升典故的應用及解讀能力。

蘇軾詩引用典故的 出處、方法、形式、含義、修辭技巧 以典籍內容為典、以個人單篇文章內容為典、以民俗、諺語、世傳小語為典、以「人+事」為典、以己之作為典等五種 方法 語典、事典(人、事、人+事)、語事混合典等三種。 形式 句句用典、多句用一典、一句用多典、一句用一典等四種 含義 直用其義、多典多轉折、出處相同,取義不同、詞彙相同,出處不同,詞義不同等四種 修辭技巧 一句中直用原文、一句中變化原文、分散於二句以上、以對仗呈現、使用倒裝句、數字換算等六種

典故的元素 從典故的定義以及典故的用法可知,典故詞語包含三種基本元素 人名 某人之某語(語典)、某人之某事(事典) 書篇名 某人某書(語典) 、某人某文 (語典) 關鍵詞 典故詞彙 相關的詞彙

以資訊科技解決詩詞典故的可行性 電腦的記憶能力可以解決「博覽群書」的問題 適當的資料描述與標記可以解決「旁徵博引」時語意判斷的問題 詩人所引用的既有文獻是過往的資料,是固定的 典故元素之「人」與「事」是固定的,後者範圍比前者廣。 同一位詩人會重複使用同一個典故 不同詩人會重複使用同一個典故

紙本典故辭典的使用功能 以典故詞彙首字筆畫建立索引目錄 列出一些例句 以典故詞彙建立典故語意關係 一、相關典故:典故出處相同,詩句中所側重的詞義不同(用詞或相同或不同)。 二、同義典故:典故出處相同,詩句中所取的詞義相同(用詞或相同,或不同) 。 三、參見典故:典故出處不同,詩句中所取的詞義相同或相近(用詞不同) 。

紙本典故辭典的使用侷限 涵蓋範圍有限:紙本工具書受限於篇幅,只能舉例列出,無法完整呈現所有詩作的所有典故用語。 翻檢速度無法與電腦相比:人工翻閱查檢的速度比不上電腦的快速與完整。 只能從詞彙查詢:紙本工具書編纂方式只能從詩人所使用的典故詞彙去查詢,查詢的切入點不足。 不能兼顧各種使用變化的典故:典故的構詞方式千變萬化,儘管編纂時已列出相關、同義、參見典故,仍然很難完整呈現所有典故的詞彙。 不能以詞彙之外的其他典故元素查詢:「人」是典故的重要元素,不能以「人名」查詢,降低紙本典故辭典使用的方便性。

以資源共享的觀點建構詩詞典故資料庫所提供的功能 跨資料庫的全文檢索功能 詩詞文本的全文比對功能 詩詞文本的典故顯示功能 詩詞創作的典故引用功能

電子本典故辭典的功能 能涵蓋紙本典故辭典所有功能 提供全文檢索:以典故詞彙、相關人名、典故出處、典故出處內容的全文檢索 建立不同索引:典故詞彙、相關人名、典故出處 以【詩詞典故辭典網站】為例

電子本典故辭典的侷限 只能查詢典故辭典所蒐集的典故 只能解決已經經過註解的詩詞文本之典故 不能解決未經註解的詩詞之典故解讀問題 不能解決寫詩時引用典故的問題

解決方法 建構詩詞典故資料庫 以資源共享的觀點 以跨資料庫的方法 以適當的內容描述與欄位設計 以適當的知識結構建立資訊表達架構

解決與建構的步驟 分析典故的特性:典故所包含的元素、詩人用典的方法 資料描述與欄位設計 知識結構與資訊表達架構設計

分析典故的特性 典故所包含的元素:人、事、詞彙 詩人用典的方法:語典、事典、語事混合典

資料描述與欄位設計 以薏苡、薏苡謗、薏苡冤、薏苡讒 蘇軾〈次韻和王鞏六首〉: 「巧語屢曾遭薏苡,廋詞聊復託芎藭 」為例 資料描述與欄位設計 以薏苡、薏苡謗、薏苡冤、薏苡讒 蘇軾〈次韻和王鞏六首〉: 「巧語屢曾遭薏苡,廋詞聊復託芎藭 」為例 典故相關詞彙 典故相關人名 典故出處 典故出處全文 典故含義 典故例句

知識結構與資訊表達架構設計 詩詞典故資料庫 詞彙 人名 出處 內容 顯示詩詞典故例句 含義 查詢 全唐詩 唐宋詞 宋詩 元曲 典故內容描述 經、史、子、集數位資料庫(十三經、廿五史、全唐詩、唐宋詞……等 查詢 全唐詩 唐宋詞 宋詩 元曲 典故內容描述 比對 寫作引用參考 引用 顯示 跨資料庫連結查詢顯示典故註解 典故詞彙

提供的功能 查詢 比對 顯示 引用 使用者輸入所欲查詢的資料,查詢典故出處與原典內容,提供典故辭典的工具書功能。 未收入詩詞典故辭典的資料,從詩詞典故之詞彙關鍵詞跨經史子集等現有資料庫比對,顯示該詞彙在那些典籍使用過,以尋找可能的典故出處,並可與詩詞作品資料庫比對,顯示那些詩作使用過這些詞彙,比對的結果可以幫助使用者判斷未經註解的詩詞作品是否是典故?可以適度解決詩詞作品的典故註解問題。 顯示 以詩詞典故辭典之詞彙與詩詞作品資料庫比對,一者以顯示歷代詩作引用該典故的所有例句。提供從詩作顯示典故註解的功能,降低閱讀詩作時無法理解典故含義的障礙 引用 寫詩時如何引用典故,對讀者的困難,除了因學力之不足以外,如何應用也是問題。典故描述時,所設計的「含義與用法」欄位,正可幫助使用者依詩意所需引用典故。

典故註解的問題:以蘇軾詩典故為例 未加註解 〈重寄〉:「薛宣真欲吏朱雲」 、〈用舊韻送魯元翰知洺州〉:「惟君綈袍信」 註解遺漏 蘇軾詩三次引用黃初平的典故,二次加註,一次未註 蘇軾二次引用馬援因薏苡而為讒言所困的典故 ,一次加註,一次未註 蘇軾二次引用駿犬送信的典故,一次加註,一次未註 註解不足 〈次韻王定國書丹元子寧極齋〉:「人那識郗鑑,天不留封倫。」王文誥引趙次公註曰:「唐人詩:『可憐貞觀太平後,天且不留封德彝。』」這是杜牧〈過魏文貞公宅〉詩 ,但未註明「《新校本舊唐書》卷六十三列傳第十三封倫 」之原出處,致使語意不足。 註解錯誤 誤引出處而錯誤:〈夜直秘閣呈王敏甫〉:「只有閑心對此君」 引述出處錯誤:〈用前韻再和霍大夫〉:「行看鳳尾詔,卻下虎頭州。」 引述內容錯誤 :〈百步洪二首〉:「佳人未肯回秋波」

解決的方法:以蘇軾詩典故為例 以人名查詢 如有人名以人名查詢,將查詢結果之內容與詩句比對,選取與詩意相合的內容,即為該典故之引用出處。以人名為典故者,通常以事典居多,因此可優先從史書資料查詢。例如:〈重寄〉:「薛宣真欲吏朱雲」 以關鍵詞查詢 如無人名,則改以關鍵詞查詢,以關鍵詞查詢時需要判斷那一個詞彙比較可能是引用典故的詞彙,通常詞彙之字面意義若不足以涵蓋該首詩的意義時,通常是典故。非人名等專有名詞之典故,通常以語典居多,可先查詢現有的典故辭典,或文學作品,先了解其他人是否用過相同詞彙,其次再查史書。 交錯查詢 以人名及關鍵詞交錯查詢,如:〈南禪長老和詩不已,故作《六蟲篇》答之〉:「而比談天衍」,以「談天」查詢二十五史資料庫,獲得24筆資料,再改以「談天衍」查詢,縮小為5筆,從中篩選適當資料。 以地名查詢 以地名當作典故的機率比人名、詩句詞彙少,如:〈次韻陽行先〉:「已逃鸚鵡洲」典出《玉泉子》:「劉允章怒皮日休曰:『君何以薄穆判官呼?鸚鵡洲在此,即黃祖沉禰衡之所也。』舉席為之懼,日休雨涕而已。」

提供的加值應用 研究 1.詩人詩風與思想傳承的研究 2.詩詞語言學的研究(典故用語變化) 教/學 典故自動標記、顯示等註解功能 創作 引用典故作為寫詩之修辭方法

尚待解決的問題 典故用語千變萬化,典故詞彙如何擷取?如何做詞彙控制? 電腦可以百分之百比對「字形」相符的資料,但無法分辨字義,因此,除非該詞彙已經經過內容的描述,否則電腦在比對時,仍有可能產生「字形相符」但「字詞義不符」或「字詞義相符」但「字形不符」的狀況。 電腦分析、比對、記憶、檢索的能力,雖然比人腦強上千萬倍,但認知、理解與判斷的能力,仍無法與人相比,若要提升,還有賴於更多的資料描述、語意標記與語意概念邏輯的建立。 文本事先經過斷詞,典故自動標示的正確率會提高。

系統演示 查詢功能:以【詩詞典故辭典】網站為例 比對與顯示的功能:以【全唐詩】及【蘇軾詩】網站為例 引用的功能:以【依韻作詩格律自動檢測索引教學系統】為例

結語 專業網站的建置需由內容領域專家主導,並與資訊領域專家合作 好的網站須以紮實的研究為基礎 電腦做得比人好的,交給電腦做,人去做電腦還不能做的事,並設法教會電腦也能做。 善用跨資料庫的機制,建立加值應用 從使用者的觀點設計使用功能 以更人性化、更貼心的設計降低人機之間的疏離感(以賴和網站手稿翻書、眉批為例)

感謝耐心聆聽 敬請批評指教