Presentation is loading. Please wait.

Presentation is loading. Please wait.

以資源共享的觀點建構數位文史工具書的方法: 以詩詞典故辭典網站為例 數位時代漢學研究資源國際研討會

Similar presentations


Presentation on theme: "以資源共享的觀點建構數位文史工具書的方法: 以詩詞典故辭典網站為例 數位時代漢學研究資源國際研討會"— Presentation transcript:

1 以資源共享的觀點建構數位文史工具書的方法: 以詩詞典故辭典網站為例 數位時代漢學研究資源國際研討會
以資源共享的觀點建構數位文史工具書的方法: 以詩詞典故辭典網站為例 數位時代漢學研究資源國際研討會 元智大學中語系‧羅鳳珠、蔡宛純

2 研究目的 圖書文獻可以分為原典文獻與工具書文獻,前者用以閱讀,後者用以參考。因為工具書文獻主要的用途在查檢資料出處,不在閱讀,所以將之數位化並提供檢索功能的需求迫切性與對使用者的方便性都比原典文獻高。 典故是寫作及解讀詩詞最大的障礙 解決詩詞典故之解讀與寫作之引用的問題 建立詩詞典故辭典網站 建立詩詞典故自動標示顯示功能

3 研究方法 分析典故的內容元素 分析詩人用典的方法 建構典故的描述方式與標記欄位 建構典故的知識結構與資訊表達架構
以蘇軾詩為範圍、以【詩詞典故辭典網站】為基礎 以中研院【漢籍資料庫】及元智大學【網路展書讀網站】為跨資料庫之範圍

4 典故的定義 一、詩詞等韻文由於受到格律之字數的限制,使用典故成為修辭的重要技巧。
二、所謂典故,一般辭書的解釋是:「詩文等作品中引用的古代故事和有來歷出處的詞語」 語典 語典指變化前人詞語,但沿用前人語意的寫法 事典 引用古代故事或某人生平事蹟以豐富內容含意的寫法 語事混合典 融合前人用過的典故之用語及同一個典故故事為內容的用法

5 典故的解讀與引用的困難 典故的出處,多數來自於文獻上所記載的語句與事蹟,少數來自於民俗諺語或世傳用語。
「博覽群書」、「旁徵博引」便成為詩人寫詩與讀者解讀典故的首要條件。 從「博覽群書」到能「旁徵博引」,須皓首窮經,須理解與記憶,豈是三年五載可及?如蘇軾、顧炎武者,古今有幾?

6 引用資訊科技解決詩詞典故問題的 能與不能 能 電腦強大的儲存、記憶、搜尋、比對的能力,可以解決「博覽群書」所需的記憶能力。 不能
只能分辨字形,不能理解語意(字形相同,語意未必相同;語意相同,字形未必相同)

7 引用資訊科技解決詩詞典故問題的方向 在電腦只能分辨字形,無法理解語意的侷限之下,如何使電腦從辨認字形提升到理解語意?
如何使電腦「旁徵博引」的品質更接近人腦?(使電腦能分辨典故語意) 詩人寫詩及讀者解讀詩作,如何藉助資訊科技工具的幫助,提升典故的應用及解讀能力。

8 蘇軾詩引用典故的 出處、方法、形式、含義、修辭技巧
以典籍內容為典、以個人單篇文章內容為典、以民俗、諺語、世傳小語為典、以「人+事」為典、以己之作為典等五種 方法 語典、事典(人、事、人+事)、語事混合典等三種。 形式 句句用典、多句用一典、一句用多典、一句用一典等四種 含義 直用其義、多典多轉折、出處相同,取義不同、詞彙相同,出處不同,詞義不同等四種 修辭技巧 一句中直用原文、一句中變化原文、分散於二句以上、以對仗呈現、使用倒裝句、數字換算等六種

9 典故的元素 從典故的定義以及典故的用法可知,典故詞語包含三種基本元素 人名 某人之某語(語典)、某人之某事(事典) 書篇名
某人某書(語典) 、某人某文 (語典) 關鍵詞 典故詞彙 相關的詞彙

10 以資訊科技解決詩詞典故的可行性 電腦的記憶能力可以解決「博覽群書」的問題 適當的資料描述與標記可以解決「旁徵博引」時語意判斷的問題
詩人所引用的既有文獻是過往的資料,是固定的 典故元素之「人」與「事」是固定的,後者範圍比前者廣。 同一位詩人會重複使用同一個典故 不同詩人會重複使用同一個典故

11 紙本典故辭典的使用功能 以典故詞彙首字筆畫建立索引目錄 列出一些例句 以典故詞彙建立典故語意關係
一、相關典故:典故出處相同,詩句中所側重的詞義不同(用詞或相同或不同)。 二、同義典故:典故出處相同,詩句中所取的詞義相同(用詞或相同,或不同) 。 三、參見典故:典故出處不同,詩句中所取的詞義相同或相近(用詞不同) 。

12 紙本典故辭典的使用侷限 涵蓋範圍有限:紙本工具書受限於篇幅,只能舉例列出,無法完整呈現所有詩作的所有典故用語。
翻檢速度無法與電腦相比:人工翻閱查檢的速度比不上電腦的快速與完整。 只能從詞彙查詢:紙本工具書編纂方式只能從詩人所使用的典故詞彙去查詢,查詢的切入點不足。 不能兼顧各種使用變化的典故:典故的構詞方式千變萬化,儘管編纂時已列出相關、同義、參見典故,仍然很難完整呈現所有典故的詞彙。 不能以詞彙之外的其他典故元素查詢:「人」是典故的重要元素,不能以「人名」查詢,降低紙本典故辭典使用的方便性。

13 以資源共享的觀點建構詩詞典故資料庫所提供的功能
跨資料庫的全文檢索功能 詩詞文本的全文比對功能 詩詞文本的典故顯示功能 詩詞創作的典故引用功能

14 電子本典故辭典的功能 能涵蓋紙本典故辭典所有功能 提供全文檢索:以典故詞彙、相關人名、典故出處、典故出處內容的全文檢索
建立不同索引:典故詞彙、相關人名、典故出處 以【詩詞典故辭典網站】為例

15 電子本典故辭典的侷限 只能查詢典故辭典所蒐集的典故 只能解決已經經過註解的詩詞文本之典故 不能解決未經註解的詩詞之典故解讀問題
不能解決寫詩時引用典故的問題

16 解決方法 建構詩詞典故資料庫 以資源共享的觀點 以跨資料庫的方法 以適當的內容描述與欄位設計 以適當的知識結構建立資訊表達架構

17 解決與建構的步驟 分析典故的特性:典故所包含的元素、詩人用典的方法 資料描述與欄位設計 知識結構與資訊表達架構設計

18 分析典故的特性 典故所包含的元素:人、事、詞彙 詩人用典的方法:語典、事典、語事混合典

19 資料描述與欄位設計 以薏苡、薏苡謗、薏苡冤、薏苡讒 蘇軾〈次韻和王鞏六首〉: 「巧語屢曾遭薏苡,廋詞聊復託芎藭 」為例
資料描述與欄位設計 以薏苡、薏苡謗、薏苡冤、薏苡讒 蘇軾〈次韻和王鞏六首〉: 「巧語屢曾遭薏苡,廋詞聊復託芎藭 」為例 典故相關詞彙 典故相關人名 典故出處 典故出處全文 典故含義 典故例句

20 知識結構與資訊表達架構設計 詩詞典故資料庫 詞彙 人名 出處 內容 顯示詩詞典故例句 含義 查詢 全唐詩 唐宋詞 宋詩 元曲 典故內容描述
經、史、子、集數位資料庫(十三經、廿五史、全唐詩、唐宋詞……等 查詢 全唐詩 唐宋詞 宋詩 元曲 典故內容描述 比對 寫作引用參考 引用 顯示 跨資料庫連結查詢顯示典故註解 典故詞彙

21 提供的功能 查詢 比對 顯示 引用 使用者輸入所欲查詢的資料,查詢典故出處與原典內容,提供典故辭典的工具書功能。
未收入詩詞典故辭典的資料,從詩詞典故之詞彙關鍵詞跨經史子集等現有資料庫比對,顯示該詞彙在那些典籍使用過,以尋找可能的典故出處,並可與詩詞作品資料庫比對,顯示那些詩作使用過這些詞彙,比對的結果可以幫助使用者判斷未經註解的詩詞作品是否是典故?可以適度解決詩詞作品的典故註解問題。 顯示 以詩詞典故辭典之詞彙與詩詞作品資料庫比對,一者以顯示歷代詩作引用該典故的所有例句。提供從詩作顯示典故註解的功能,降低閱讀詩作時無法理解典故含義的障礙 引用 寫詩時如何引用典故,對讀者的困難,除了因學力之不足以外,如何應用也是問題。典故描述時,所設計的「含義與用法」欄位,正可幫助使用者依詩意所需引用典故。

22 典故註解的問題:以蘇軾詩典故為例 未加註解 〈重寄〉:「薛宣真欲吏朱雲」 、〈用舊韻送魯元翰知洺州〉:「惟君綈袍信」 註解遺漏
蘇軾詩三次引用黃初平的典故,二次加註,一次未註 蘇軾二次引用馬援因薏苡而為讒言所困的典故 ,一次加註,一次未註 蘇軾二次引用駿犬送信的典故,一次加註,一次未註 註解不足 〈次韻王定國書丹元子寧極齋〉:「人那識郗鑑,天不留封倫。」王文誥引趙次公註曰:「唐人詩:『可憐貞觀太平後,天且不留封德彝。』」這是杜牧〈過魏文貞公宅〉詩 ,但未註明「《新校本舊唐書》卷六十三列傳第十三封倫 」之原出處,致使語意不足。 註解錯誤 誤引出處而錯誤:〈夜直秘閣呈王敏甫〉:「只有閑心對此君」 引述出處錯誤:〈用前韻再和霍大夫〉:「行看鳳尾詔,卻下虎頭州。」 引述內容錯誤 :〈百步洪二首〉:「佳人未肯回秋波」

23 解決的方法:以蘇軾詩典故為例 以人名查詢 如有人名以人名查詢,將查詢結果之內容與詩句比對,選取與詩意相合的內容,即為該典故之引用出處。以人名為典故者,通常以事典居多,因此可優先從史書資料查詢。例如:〈重寄〉:「薛宣真欲吏朱雲」 以關鍵詞查詢 如無人名,則改以關鍵詞查詢,以關鍵詞查詢時需要判斷那一個詞彙比較可能是引用典故的詞彙,通常詞彙之字面意義若不足以涵蓋該首詩的意義時,通常是典故。非人名等專有名詞之典故,通常以語典居多,可先查詢現有的典故辭典,或文學作品,先了解其他人是否用過相同詞彙,其次再查史書。 交錯查詢 以人名及關鍵詞交錯查詢,如:〈南禪長老和詩不已,故作《六蟲篇》答之〉:「而比談天衍」,以「談天」查詢二十五史資料庫,獲得24筆資料,再改以「談天衍」查詢,縮小為5筆,從中篩選適當資料。 以地名查詢 以地名當作典故的機率比人名、詩句詞彙少,如:〈次韻陽行先〉:「已逃鸚鵡洲」典出《玉泉子》:「劉允章怒皮日休曰:『君何以薄穆判官呼?鸚鵡洲在此,即黃祖沉禰衡之所也。』舉席為之懼,日休雨涕而已。」

24 提供的加值應用 研究 1.詩人詩風與思想傳承的研究 2.詩詞語言學的研究(典故用語變化) 教/學 典故自動標記、顯示等註解功能 創作
引用典故作為寫詩之修辭方法

25 尚待解決的問題 典故用語千變萬化,典故詞彙如何擷取?如何做詞彙控制?
電腦可以百分之百比對「字形」相符的資料,但無法分辨字義,因此,除非該詞彙已經經過內容的描述,否則電腦在比對時,仍有可能產生「字形相符」但「字詞義不符」或「字詞義相符」但「字形不符」的狀況。 電腦分析、比對、記憶、檢索的能力,雖然比人腦強上千萬倍,但認知、理解與判斷的能力,仍無法與人相比,若要提升,還有賴於更多的資料描述、語意標記與語意概念邏輯的建立。 文本事先經過斷詞,典故自動標示的正確率會提高。

26 系統演示 查詢功能:以【詩詞典故辭典】網站為例 比對與顯示的功能:以【全唐詩】及【蘇軾詩】網站為例
引用的功能:以【依韻作詩格律自動檢測索引教學系統】為例

27 結語 專業網站的建置需由內容領域專家主導,並與資訊領域專家合作 好的網站須以紮實的研究為基礎
電腦做得比人好的,交給電腦做,人去做電腦還不能做的事,並設法教會電腦也能做。 善用跨資料庫的機制,建立加值應用 從使用者的觀點設計使用功能 以更人性化、更貼心的設計降低人機之間的疏離感(以賴和網站手稿翻書、眉批為例)

28 感謝耐心聆聽 敬請批評指教


Download ppt "以資源共享的觀點建構數位文史工具書的方法: 以詩詞典故辭典網站為例 數位時代漢學研究資源國際研討會"

Similar presentations


Ads by Google