TTS (文字轉語音) Roger Jang (張智星) jang@cs.nthu.edu.tw http://www.cs.nthu.edu.tw/~jang 多媒體資訊檢索實驗室 清華大學 資訊工程系
TTS Goal Related technologies Demo by our lab TTS: Text-to-speech synthesis (文字轉語音, 語音合成) Related technologies 文字處理:自動斷詞、變調規則、人名辨識、定量複合詞、疊詞分析、數字分析、語意分析 語音處理:語音切割、音調調整、音長調整 Demo by our lab http://tts.mirlab.org
語音合成簡介 方法可分兩大類 技術困難點 接合式:音質較好,但自然度較差 HMM韻律產生式:自然度較好,但音質較差 斷詞:我到廟口吃小吃 變調: 總統、總統府、李總統、母老虎、膽小鬼 老李買把小雨傘
Text-to-speech (TTS) Synthesis Two types Concatenation-based: Better sound quality HMM-based: Better fluency Technical issues for Mandarin TTS Word segmentation: 我到廟口吃小吃 Tone Sandhi: 總統、總統府、李總統、母老虎、膽小鬼 老李買把小雨傘
Practical Considerations for TTS Applications Dialog btw. users and avatars (與虛擬人物對話) Query for correct pronunciation (發音查詢) Story telling (自動說故事) Technical issues Platforms (平台) Size of the corpus (語料大小) Footprint of code (程式碼大小)
TTS Demos ITRI (工研院資通所) iFly Tech (中科大訊飛科技) MIR TTS http://atc.ccl.itri.org.tw/ iFly Tech (中科大訊飛科技) http://www.iflytek.com/audioengine/list_4.html MIR TTS http://tts.mirlab.org