中文字的特性 (一)中文字的屬性 中文字兼具形、音和義三者,不同於表音字母(alphabets)的只具形和音(例如:英文字母、日語假名、阿拉伯文字等),因而被稱為表意文字(ideographs) 。
就目前的中文資訊處理能力而言,處理中文字的形和音的方法與技術已經達實用的程度,但是對於表達和處理字義的研究,則有待突破。
1.與中文字輸入相關者:依據某些種輸入法(例如:倉頡輸入法)所逐字賦予的形碼、某些中文碼(例如:Big5碼),甚或不常用的四角碼、三角碼等。 中文字的屬性(attributes)意指用以描述中文字的形和音的一些訊息,這些訊息主要運用於中文字的輸入、輸出和排序等場合。中文字的字形屬性,包括: 1.與中文字輸入相關者:依據某些種輸入法(例如:倉頡輸入法)所逐字賦予的形碼、某些中文碼(例如:Big5碼),甚或不常用的四角碼、三角碼等。 2.與中文字輸出相關者:某幾種字型(font,例如:楷書、宋體、黑體、隸書等)的點陣,以及依某些種向量組字規範(例如:True type、Postscript等)所逐字賦予的字型表示式。 3.與中文字分類、排序相關者:部首、筆劃數(不含部首)、總筆劃數(含部首)、組字部件、筆順等。
中文字的字音屬性 國語發音由21個聲母(例如:ㄅ、ㄆ、ㄇ、ㄈ等)和39個韻母(例如:ㄧ、ㄨ、ㄩ、ㄧㄡ、ㄨㄟ、ㄩㄝ等)所組成,若不考慮聲調變化,共有411個基本發音。加上五聲(第一至第四聲和輕聲)變化,則可演化成2,055個不同的發音。
中文字的特性 中文字數量龐大,但常用字僅佔少數 ,學會3,000個最常用的中文字就能認得近代中文報章、書籍用字的99%。
秦 倉頡篇 李斯 3,300 漢 1~5 訓纂篇 揚雄 5,340 2,040 漢 60~70 續訓纂篇 班固 6,120 780 時代 西元年份 書 名 作 者 所收字數 遞增字數 秦 倉頡篇 李斯 3,300 漢 1~5 訓纂篇 揚雄 5,340 2,040 漢 60~70 續訓纂篇 班固 6,120 780 漢 100 說文解字 許慎 9,353 3,233 魏 227~239 聲類 李登 11,520 2,167 晉 字林 呂忱 12,824 1,304 後魏 字統 楊承慶 13,734 910 後魏 480 廣雅 張揖 18,150 4,416 梁 543 玉篇 顧野王 22,726 4,576 唐 751 唐韻 孫愐 26,194 3,468 唐 753 韻海鑑源 顏真卿 26,911 717 宋 1037~1067 集韻 丁度 29,992 3,081 宋 1066 類篇 王洙等 31,319 3,319 明 1615 字彙 梅膺祚 33,179 1,860 清 1675 正字通 張自烈 33,440 261 清 1716 康熙字典 張玉書等 42,174 8,734 現代 1915 中華大字典 中華書局 44,908 2,734 現代 1969 中文大辭典 張其昀等 49,888 4,980 現代 1990 漢語大字典 徐中舒等 54,678 4,790 現代 2004 異體字字典第五版 106,230 51,552 教育部國語推行委員會
教育部國語推行委員會《八十四年常用語詞調查報告書》就總計1,982,882字次的語料加以分析,共找出5,731個相異的中文字。根據該報告所附的「字頻總表」,出現頻率最高的中文字「的」其出現頻率為1.65%
二十五史的中文字出現總和為31,409,450字次,共使用了13,966個中文字,較常用的中文字,總數不超過4,000。 除此之外的大多數中文字出現在個別檔當中,其頻率平均還不到兩次(事實上,大多數僅出現一次)。可見中文字的使用頻率主要是受到個人識字、用字能力的限制,而與時空環境變遷的關係不大。 *現代中文電腦大陸的系統規定只有6763個標 準簡體字、而台灣系統的則有13053個正體 字。
所有辭彙皆可由單字、單詞輕易組合而成新義 所有辭彙皆可由單字、單詞輕易組合而成新義 如大學、大家、電話、電視、電腦等等。故識字不多,即足應付日常之需。東漢許慎說文解字成書於西元100年,收字9353字,而成書於康熙55年西元1716年之康熙字典,收字亦僅42174字。1616年間中國文字僅增32821字而已,而其中常用字充其量不過4000,已足敷日常之需。以下諸書字數統計可以見出中國文字學、用之便易: 十三經 6544字 五經 4754字 杜甫詩 4390字 王維詩 2473字 四書 2328字 三民主義 2134字 憲法 682字
*中文單字的使用頻率會因時、因地,以及因應用領域而異 例一,「璿」、「堃」兩字原本不是常用的中文字,但是在孫運璿、遊錫堃兩位先生分別擔任行政院長期間,由於他們的姓名幾乎是天天見報,因而使得「璿」、「堃」字的使用頻率明顯激增,幾乎變成新聞業者的常用字。
例二,「冇」(發音近似ㄇㄡˇ,意為「沒有」)為粵語方言字,在香港地區可算是常用字,但在非粵語地區則極少使用。
例三,在一般白話檔裡,使用頻率最高的中文字為「的」,但是在電信、電力、自來水等用戶資料庫裡,「的」字卻甚為罕見,取而代之的最常用字為每個用戶地址裡都有的「號」字。
*中文會因時、因地、因事而造新字 例如:中文字隨著時間而增加字數,台灣早期移民常以發音近似的中文字加上「口」邊以音譯原住民地名、武則天為命己名而造新字「曌」、有些化學元素名稱 、魚類名稱、生物化學用字為近代所創……等。
字形特性 *中文字多異體字 若兩個中文字同音、同義,卻不同字形,則稱這兩個中文字互為異體字。一般說來,常用的中文字較易於產生異體字。例如,常用的「台」和「臺」兩字即互為異體字;由於中文一字多義,使得一些中文字在某些中文詞裡可以互換(可視為異體字),但在別的中文詞裡卻又不能互換使用。例如,「五元」可以寫成「伍圓」,但「行伍」卻不同於「行五」,「元首」不能寫成「圓首」。這種現象對中文資訊檢索造成相當大的困擾。
字形特性 (一)字體方正如圖,易於辨識 日本人嘗於高速公路並豎中、日、英文路標,令駕車者以定距、定速前進,測其辨識三種文字之速度,發現中文辨識最快,日文次之,英文為殿。因中文為方塊、獨立的圖案,讀字猶如視圖,且僅讀其部份,即可猜知全文,而英文則須通讀每一字母,始能瞭解全文也。
字形特性 (二)字字獨立,排列方便,可作任一走 向書寫與閱讀 如商家玻璃門、窗廣告文字,兩面讀之,皆可辨識,其他拼音文字如英文則不能。又,中國文字無論遮其上、下、左、右,僅露其半,仍多可識,拼音文字則萬萬不能。 (例:可以清心也、本日大賣出)
字形特性 (三)形聲造字,體便分合 中國文字十之七八為形聲字,字分二部,乃至三四部組合造字,體便分合,因此造字簡易,且利辨識 (切瓜分片 橫七刀豎八刀、雲破月來花弄影—能 、 張長弓 騎奇馬 )。
聲音特性 (一)單一音節,發音容易,而有節奏感 每字最多由聲母、介音、韻母三部份組成,而僅具單一音節,如:「平」字;少則僅有韻母而已,如:「安」字。因此發音容易,而有節奏感。 例外:琵琶.葡萄.玻璃.蝴蝶.蜻蜓.螳螂.逍遙.徘徊.徬徨.躊躇.踟躕.婆娑.玲瓏.窈窕 --連綿詞(不可拆開的詞)
聲音特性 音義相關 同音,或同一聲母,或同一韻母之字,其義類似,且其字義與發音口 形亦有密切關係:如:宏、洪、鴻、泓、閎皆有「大」義,而此時口 形恰亦最大。又如:纖、線、細、絲皆有細義,其音乃齒間音,氣息通過齒間出出聲時,恰成一細線。又如:彎、灣、宛、轉、團、圞、 管、環、丸皆有圓義,蓋其發音口形恰成圓形也。
聲音特性 一字多音(破音字)一字多音,音異則義異 破音字的產生,一方面因為古人的假借,一方面因為時間的變動以及地方的不同,造成讀音的差異。 例:以女女女,女將如何待之? 發音是ㄧˇ ㄋㄩˇ ㄋㄩˋ ㄖㄨˇ,ㄖㄨˇ ㄐㄧㄤ ㄖㄨˊ ㄏㄜˊ ㄉㄞˋ ㄓ,意思是說我把我女兒嫁給你,你將會如何對待他
聲音特性 多字一音(同音字) 二字一音可形成一語雙關(諧音)之趣味;然如多字一音,則易致語意不明,是其缺點。
聲音特性 施氏食獅史(趙元任): 石室詩史施氏,嗜獅,誓食十獅。氏時時適市視獅。十時,適十獅適市。是時,適施氏適市。氏視是十獅,恃矢勢,使是十獅逝世。氏拾是十獅適氏石室。石室濕,氏拭室。氏始試食十獅屍。食時,始識是十獅屍實十石獅。試釋是事。
聲音特性 伊姨殪,遺億鎰。伊詣邑,意醫姨疫,一醫醫伊姨。翌,億鎰遺,疑醫,以議醫。醫以伊疑,縊,以移伊疑。伊倚椅以憶,憶以億鎰遺,以議伊醫,亦縊。噫!亦異矣 (〈遺鎰疑醫〉趙元任) 于瑜欲漁,遇余于寓。語余:“余欲漁于渝淤,與余漁渝歟?”余語于瑜:“余欲鬻玉,俞禹欲玉,余欲遇俞于俞寓。”余與于瑜遇俞禹于俞寓,逾俞隅,欲鬻玉于俞,遇雨,雨逾俞宇。余語于瑜:“余欲漁于渝淤,遇雨俞寓,雨逾俞宇,欲漁歟?鬻玉歟?”于瑜與余禦雨于俞寓,俞鬻玉于余禹,雨愈,余與于瑜踽踽逾俞宇,漁于渝淤(楊富森〈于瑜與余欲漁遇雨〉)。
聲音特性 李清照.聲聲慢 尋尋,覓覓,冷冷,清清,悽悽,慘慘,戚戚。乍暖還寒時候,最難將息。三杯兩盞淡酒,怎敵他晚來風急。雁過也,正傷心,卻是舊時相識。滿地黃花堆積,憔悴損,如今有誰堪摘?守著窗兒,獨自怎生得黑?梧桐更兼細雨,到黃昏點點滴滴。這次第,怎一個愁字了得!
擬聲聯 獨覽梅花掃臘雪 依睨山勢舞流溪 Do Re Mi Fa So La Si 1 2 3 4 5 6 7
字義特性 漢字是世界獨有的概念文字,其中蘊涵的微言大義,是古人思維的結晶,數千年來行文乃至思考的根本,因此古文能夠言簡意賅,含意深遠。但由於白話文運動鼓吹以「詞」取代「字」,現在的辭典僅解釋詞義而不談及該詞義的由來;而現代的字典則多以詞為基準,將漢字分成一條一條解釋,違反漢字本質,令漢字看似費解且難以學習。漢字「本義」被人忘卻,現代人中文水平低落,正因不能辨明字義所致。
字義特性--引申義 從本義引申發展出來的意義,是造成漢字一字多義的重要原因。引申義與本義有一定聯繫,它是人類思維運動即在語言運用中發揮了聯想和類推作用的結果。 活——本義是水流暢通(活水)。引申之,凡是動的東西都叫「活」(活塞)。進而有生命的東西都叫「活」。進而生物的存在方式叫做「活」 。 朝:「早晨」—朝見—朝廷—朝代
字義特性—假借義 通過文字的同音假借使該字表示的意義 假借是把漢字當成一個純粹的表音符號。假借使一個漢字起到了幾個漢字的作用。 1、本無其字的假借 一種情況是,假借字一直歸該詞使用: 「其」,本義「畚箕」,借為代詞、語氣詞。後為本義造「箕」。 「耳」,本義「耳朵」,借為語氣詞「耳」 ,借義和本義並存。
字義特性—假借義 2、本有其字的假借(通假) 常見的通假例: 共——供 闕——缺 說——悅 知——智 取——取 反——返 共——供 闕——缺 說——悅 知——智 取——取 反——返 直——只 有——又 景——影 坐——座 縣——懸 曷——何
文法 1.文法簡單,無人稱、單複數、時態、性質、詞類變化等等複雜文法規則 孤村、落日、殘霞;輕煙、老樹、寒鴉。一點飛鴻影下,青山、綠水、白草、紅葉、黃花。 ---白樸〈天淨沙〉 。 枯藤、老樹、昏鴉;小橋、流水、人家;古道、西風、瘦馬。夕陽西下,斷腸人在天涯。 ---馬致遠〈天淨沙〉
文法 2.所有辭彙皆可由單字、單詞輕易組合而成新義 如大學、大家、電話、電視、電腦等等。故識字不多,即足應付日常之需。