台灣元智大學‧羅鳳珠、邱筱榆、林宜嫺 代為宣讀:北京大學‧胡俊峰 唐宋詩詞分詞規則 及命名實體特徵 台灣元智大學‧羅鳳珠、邱筱榆、林宜嫺 代為宣讀:北京大學‧胡俊峰
唐宋詩詞分詞規則及命名實體特徵 前言 詩詞文體特性 分詞準則與詞彙切分方法 詩詞人名之命名實體構詞特徵 結語
前 言 本文以文學內容分析的方法,以唐宋詩詞為範圍,以符合文體特性及滿足文學研究為前提,建立詩詞韻文詞彙切分原則,探討詩詞文體人名之命名實體構詞特徵,以作為進行命名實體標註規範之參考。
詩詞文體特性 詩詞是特殊的語言形式,以雙音節詞居多。 因遷就雙音節及平仄格律,使得很多詞彙只用於詩詞,不用於其他文體。 或該詞彙在詩詞裡是通順有意義的詞彙,當抽離詩詞文本時,語義便不通。 或者為了符合平仄聲調而使用方言俗語及罕用詞彙,使用特殊句法、句型。 分述如下:
詩詞文體特性:構詞特殊 使用其他文體罕用詞彙 韓愈〈南山〉詩:「敷敷花披萼,闟闟屋摧霤。」 檢視各種不同文體的文獻,韓愈以前,只有南朝范縝〈擬招隱士〉詩:「巖巖兮嶷嶷。霏霏兮敷敷」用過。韓愈之後,只有北宋呂南公〈詠榴花〉詩:「敷敷英乍含,春盡葉已碧」用過。 「闟闟」詞,韓愈之外,未曾有人用過。 名詞雙舉並列,豐富詞義 杜甫〈暮春題瀼西新賃草屋〉詩:「未息豺虎鬥,空慚鴛鷺行。」 用「豺虎」比喻安史之亂以後,乘虛而入的吐蕃、回紇等猛如豺虎的外患。 「鴛鷺」是引用鴛鴦與鷺鷥行止有序的特性比喻班列的朝官,所使用的語義都不是該名詞原有的語義。 雙音節名詞省略為單音節詞 蘇軾〈舟中夜起〉詩:「暗潮生渚弔寒蚓,落月挂柳看懸蛛。」 將「蚯蚓」與「蜘蛛」本來不能切分為單音節詞使用的雙音節詞省略為「蚓」、「蛛」,這是因為受到包含:字數、對仗、平仄、押韻等四種格律規範的限制所致,語體文不會有這種用詞方法。
詩詞文體特性:構句特殊 詞彙分散在上下句 蘇軾〈張子野年八十五尚聞買妾述古令作詩〉:「詩人老去鶯鶯在,公子歸來燕燕忙」 因受限於格律的關係,「鶯鶯燕燕」詞被分散在上下句對仗的位置。 使用倒裝句 元稹〈遣悲懷〉:「謝公最小偏憐女,自嫁黔婁百事乖。」 前句是「謝公偏憐最小女」的倒裝句。 使用略縮雙關倒裝語句 蘇軾〈和子由柳湖久涸忽有水開元寺山茶舊無花今歲盛開〉:「如今勝事無人共,花下壺盧鳥勸提」 下句完整的詞句是:「花下提壺盧鳥勸人提起壺蘆喝酒」,因為格律的約束,全句使用了倒裝句、雙關語、縮略語,而使得「壺盧」具有盛酒容器的「壺蘆」及名為「提壺蘆」或「提葫」、「提胡蘆」鳥名的雙重語義。
詩詞文體特性:用法特殊 以陵墓名稱指代人名 杜甫〈遣興〉詩:「長陵銳頭兒,出獵待明發。」 「長陵」的本義是漢高祖的陵墓名,在這一首詩用來指代「漢高祖」這個「人」,而不是指「陵墓」。 以地名指代人名 秦觀〈別子瞻〉:「我獨不願萬戶侯,惟願一識蘇徐州。徐州英偉非人力,世有高名擅區域。」 蘇軾曾經在徐州做官,這裡的「蘇徐州」與第三句的「徐州」都是指蘇軾。 以局部代表全部 元稹〈遣悲懷〉:「野蔬充膳甘長藿,落葉添薪仰古槐」 槐葉薄小,不耐燒,不適合用做薪柴。作者以槐為詞的原因是這一首詩押「佳」韻,「佳」韻所含植物類的韻字只有「槐」字,所以是以槐樹落葉來代表植物的落葉。 含雙重語義 蘇軾「花下壺盧鳥勸提」的「壺盧」 「壺盧」=提葫蘆鳥+盛酒的容器:葫蘆。
詩詞文體特性:用語特殊 除了專有名詞會為了符合平仄聲調而改用通俗名稱、方言俚語之外,在講究精緻典雅修辭技巧的詩詞裡亦是。 例如: 杜甫〈三絕句〉詩:「無數春筍滿林生,柴門密掩斷人行。會須上番看成竹,客至從嗔不出迎。」 元稹〈賦得春雪映早梅〉詩:「飛舞先春雪,因依上番梅。」 「上番」的「番」讀去聲,根據《辭源》的解釋:「唐人稱植物不斷生長為上番,為當時四川方言。」杜甫是四川人 ,元稹住過成都 。
分詞準則與詞彙切分方法 1/3 本研究將依據詩詞文體的句法特性,建立詞彙切分規則,並開發詞彙自動切分工具,輔以人工校正,建立詩詞之專有名詞、典故、疊字詞、專屬領域詞、一般詞彙等不同的詞彙資料庫。 詩詞的詞彙以雙音節為主,句子轉折處及含有領字的詞牌的首字使用單音節詞,但是專有名詞及典故詞彙字數則不固定,因此進行詩詞詞彙切分前,如能先建立下列三種資料庫,將可提高詞彙切分的正確性。分述如下:
分詞準則與詞彙切分方法 2/3 一、建立詞譜、專有名詞、典故詞彙等基本資料庫 二、詞彙切分方法與步驟之一: 分詞準則與詞彙切分方法 2/3 一、建立詞譜、專有名詞、典故詞彙等基本資料庫 二、詞彙切分方法與步驟之一: (一)以專有名詞為切分詞彙最優先順位 (二)依建立的宋詞詞譜優先將單字領字切分 (三)先切出疊字詞(茫茫) (四)比對典故詞彙資料庫,典故詞不切分 (五)「兮」字無論在任何位置,皆優先切分
分詞準則與詞彙切分方法 3/3 二、詞彙切分方法與步驟之二: (六)1.五、七言近體詩依「(七)之2、3」步驟切分 分詞準則與詞彙切分方法 3/3 二、詞彙切分方法與步驟之二: (六)1.五、七言近體詩依「(七)之2、3」步驟切分 2.六言近體詩依「(七)之1」步驟切分 3.古體詩依「(七)之1、2、3」步驟切分 (七)1.句子字數為偶數句,兩兩切分為雙音節詞 2.句子字數為奇數句,末三字之外,兩兩切分為 雙音節詞 3.奇數句之末三字,其句法為上一下二;上二下 一,無準則。 (八)詩之詞彙切分法,除了沒有領字規則,其餘均同 (九)切分正確率的高低與用以比對的詞彙資料的多寡 成正比
詩詞人名之命名實體構詞特徵1/7 本研究是在「歷代語言知識庫」之「詩詞語言知識庫」的語義概念分類基礎上,以李白、杜甫、韓愈三家詩為範圍,抽取人名類別的詞彙,分析其命名實體之構詞特徵。
詩詞人名之命名實體構詞特徵 2/7 直書本名 直書全名 韓愈〈醉留東野〉:「昔年因讀李白杜甫詩」 省略姓氏只書其名 詩詞人名之命名實體構詞特徵 2/7 直書本名 直書全名 韓愈〈醉留東野〉:「昔年因讀李白杜甫詩」 省略姓氏只書其名 杜甫〈飲中八仙歌〉:「知章騎馬似乘船」(賀知章) 雙字名省略姓氏+虛字後綴詞,使之構足雙音節 杜甫〈春日憶李白〉:「白也詩無敵」(李白+也) 雙字名省略姓氏+自由語素,使之構足雙音節 韓愈〈送僧澄觀〉:「愈昔從軍大梁下」(韓愈+昔) 自由語素+雙字名省略姓氏,使之構足雙音節 杜甫〈北征〉:「臣甫憤所切」(臣+杜甫) 省略姓或名以單字詞書寫 杜甫〈自京赴奉先縣詠懷五百字〉:「竊比稷與契」
他稱:他稱是指對他人的稱呼,詩詞中他稱的書寫方式最複雜 詩詞人名之命名實體構詞特徵 3/7 自稱 詩人於詩句中自稱時,通常以本名省略姓氏的方式書寫,也有以字號自稱者 李白〈答湖州迦葉司馬問白是何人〉:「青蓮居士謫仙人」。 杜甫〈謁文公上方〉:「甫也南北人」 他稱:他稱是指對他人的稱呼,詩詞中他稱的書寫方式最複雜 姓+子 李白〈悲歌行〉:「范子何曾愛五湖」(范蠡) 姓+生 李白〈過汪氏別業〉:「汪生面北阜」(汪倫) 官職、諡號、封號、稱號…… 杜甫〈洗兵馬〉:「關中既留蕭丞相」(蕭何) 李白〈永王東巡歌〉:「永王正月東出師」(李璘) 李白〈古風〉:「世無洗耳翁」(許由) 杜甫〈古柏行〉:「先主武侯同閟宮」(諸葛亮諡號忠武侯) 杜甫〈八哀詩〉:「際會清河公」(房琯封號清河郡公)
詩詞人名之命名實體構詞特徵 4/7 他稱的種類 1.姓+氏 2.姓+生 3.姓+子 4.姓+君 5.姓+客 6.姓+處士 7.姓+公子 詩詞人名之命名實體構詞特徵 4/7 他稱的種類 1.姓+氏 2.姓+生 3.姓+子 4.姓+君 5.姓+客 6.姓+處士 7.姓+公子 8.姓+夫子 9.姓+公 10.姓+老或叟 11.姓+地名 12.地名+姓 13.姓+員外 14.姓+卿 15.姓+大夫 16.姓+侯 17.地名+公或翁 18.姓+官銜 19.官職 20.爵位 21.世人賦予之稱號 22.諡號 23.封號 24.姓或名+親屬稱謂
詩詞人名之命名實體構詞特徵 5/7 別名字號 僧名法號 單獨使用別名字號 李白〈對雪醉後贈王歷陽〉:「子猷聞風動窗竹」(王徽之) 詩詞人名之命名實體構詞特徵 5/7 別名字號 單獨使用別名字號 李白〈對雪醉後贈王歷陽〉:「子猷聞風動窗竹」(王徽之) 姓氏+別名字號,成為三字詞,通常置於句尾 杜甫〈丹青引贈曹將軍霸〉:「但恨無過王右軍」(王羲之) 僧名法號 直書僧名法號 李白〈草書歌行〉:「少年上人號懷素」(懷素俗姓錢,字藏真) 僧名法號+自由語素 杜甫〈因許八奉寄江寧旻上人〉:「不見旻公三十年」(旻上人即傷果禪師,生平不詳 )
詩詞人名之命名實體構詞特徵並稱 6/7 姓氏並稱 李白〈留別金陵諸公〉:「詩騰顏謝名」(顏延之、謝靈運)。 以名並稱 詩詞人名之命名實體構詞特徵並稱 6/7 姓氏並稱 李白〈留別金陵諸公〉:「詩騰顏謝名」(顏延之、謝靈運)。 以名並稱 韓愈〈酬司門盧四兄雲夫院長望秋作〉:「遠追甫白感至誠」(杜甫、李白)。 姓氏並稱,雙字姓氏省略為一個字 杜甫〈鹿頭山〉:「悠然想揚馬」(揚雄、司馬相如)。 封號省稱+姓 韓愈〈陪杜侍御遊湘西兩寺,獨宿有題一首,因獻楊常侍〉:「絳灌共讒諂」(周勃被封為絳侯、灌嬰)。
詩詞人名之命名實體構詞特徵 7/7 將二位以上有某些性質可以相連的人合在一起,給予新的稱號,並廣為後人所沿用 二疏 詩詞人名之命名實體構詞特徵 7/7 將二位以上有某些性質可以相連的人合在一起,給予新的稱號,並廣為後人所沿用 二疏 杜甫〈八哀詩八首:故右僕射相國張公九齡〉:「敢忘二疏歸」(二疏指疏廣、疏受叔姪)。 二謝 杜甫〈解悶〉:「孰知二謝將能事」(二謝指謝靈運、謝朓,二人同族,都是南朝著名詩人,後人稱其為大謝、小謝,或二謝) 四皓 李白〈贈潘侍御論錢少陽〉:「眉如松雪齊四皓」(商山四皓:東園公、夏黃公、綺里季、甪里) 三士 李白〈懼讒〉:「二桃殺三士」(公孫接、田開疆、古冶子) 省稱 休上人 杜甫〈留別公安太易沙門〉:「麗藻初逢休上人」(惠休上人之省稱)。 原嘗春陵 李白〈扶風豪士歌〉:「原嘗春陵六國時」(平原君趙勝、孟嘗君田文、春申君黃歇、信陵君魏無忌等四人之省稱)
結 語 詩詞的命名實體構詞方式,一言以蔽之,都是為了符合格律的要求,以雙音節詞最多,其次是單音節詞。 結 語 詩詞的命名實體構詞方式,一言以蔽之,都是為了符合格律的要求,以雙音節詞最多,其次是單音節詞。 而地名與人名一樣,也使用別名、俗名、古地名,或以並稱、合稱、省稱等方式構詞。 動植物詞彙在詩詞裡,因附著了作者的情感而成為意象詞,多數以單音節詞書寫的動植物名稱,都會在字前或後加上其他語素,以結合成雙音節詞,既能符合格律,又可豐富語義,與之結合的語素種類及語義類別比人名、地名複雜多變,限於篇幅,只能另文探討。
致 謝 詞 謝謝聆聽,敬請指教 本文得到下列二項經費支持,特此致謝 蔣經國國際學術交流基金會「歷代語言知識庫建置計畫」(RG013-D-09) 國科會「從不能到能:以語言知識庫為基礎的作詩填詞輔助系統」(NSC101-2410-H-155-044)計畫 謝謝聆聽,敬請指教