關鍵詞辨認 (Keyword Spotting)

Slides:



Advertisements
Similar presentations
渡黑水溝 郁永河. 2 戎克船:是明末清初時期往返兩岸的主要交通工具 ∗ 1. 關於台灣的開發歷史,我們到底了解多少呢?不妨試著說出 就我們所知有關台灣開發史的故事、小說、電影、音樂與大 家分享。 ∗ 2. 什麼是黑水溝?黑水溝為什麼會成為大陸移民渡海來臺時最 大的威脅? ∗ 3. 有聽過「六死三留一回頭」、「有唐山公,無唐山嬤」這兩.
Advertisements

三年级语文下册知识汇总.
兵车行 杜甫 福州十一中语文组 林嵘臻.
成才之路 · 语文 中国现代诗歌散文欣赏 路漫漫其修远兮 吾将上下而求索.
小猪.
两汉文学及汉代诗歌.
高一(10)班化学研究性学习报告 研究课题:能源调查 指导老师:谢渊 制作人: 参与调查人人:谢渊、姜波、陈康、黄伟康 、许思琪 、王彪.
近现代文学概说.
沉痛悼念郭可信院士.
牛 汉 ——《华南虎》 …… 恍惚之中听见一声 石破天惊的咆哮, 有一个不羁的灵魂 掠过我的头顶 腾空而去, 我看见了火焰般的斑纹
牛 汉 …… 恍惚之中听见一声 石破天惊的咆哮, 有一个不羁的灵魂 掠过我的头顶 腾空而去, 我看见了火焰似的斑纹 火焰似的眼睛,
综合实践活动 设计与实践案例 ——《感恩父母》主题班会.
短歌行.
热爱党、热爱祖国、热爱人民 泉州九中初二年(10)班主题班会.
  厦门市诗坂中学 陈苑然.
高一语文 必修1 基础知识复习专题.
译书尚未成功,惊闻殒星,中国何人领呐喊;
中小企业融资担保业务交流 主讲人 陈冠宇.
赤 壁 赋 苏轼.
12* 假如没有灰尘.
逻 辑 学 主讲:李贤军.
开卷有益 成考语文复习.
片段背诵 第9课 说“木叶” 晨读 新课启航 资料助读 第三单元 识记 知识必备 主旨概览 探究 文本研读 文本层析 写法借鉴
内容提要 全文朗诵 随文注释 整篇翻译 重点提示 参考文献 自测练习 不失人情论 李中梓 课件制作:上海中医药大学医古文教研室 王兴伊.
灵枢·本神第八 主讲人 王洪京.
21、水乡歌 团结和平中心学校 李团乐.
第五单元 群星闪耀 复法指导 阅读与欣赏 单元重点 1.了解传记文的基本体例与特征。
渔 父.
第五章 菜单管理 一、菜单的定义 菜单是饭店餐厅提供商品的 目录。是餐厅餐饮产品销售的品 种、说明和价格的一览表,在餐
招商项目推介书 中科电工.
第三章 菜单的设计与制作 第一节 菜单的重要性 第二节 菜单的种类及其特点 第三节 菜单的设计与制作.
我用灵动的声音、奇异的形体和清透的心灵向你诉说,不知道你是否读懂了我———雨的心曲?
Fuzzy系統 陳詩豐 助理教授 龍華科技大學 機械系.
季羡林,山东聊城人,字希逋,又字齐奘。国际著名东方学大师、语言学家、文学家、国学家、佛学家、史学家、教育家和社会活动家。历任北京大学副校长、中国社会科学院南亚研究所所长,是北京大学的终身教授。 早年留学国外,通英、德、梵、巴利文,能阅俄、法文,尤精于吐火罗文,是世界上仅有的精于此语言的几位学者之一。为“梵学、佛学、吐火罗文研究并举,中国文学、比较文学、文艺理论研究齐飞”,其著作汇编成《季羡林文集》,共24卷。生前曾撰文三辞桂冠:国学大师、学界泰斗、国宝。
第十九课 南吕•一枝花 不 伏 老 关汉卿.
女排,中国的骄傲.
研究生 :鍾哲民 指導教授:王宗一 報告者 :林谷霖 課程指導:蘇德仁
鸿门宴 司马迁.
dtnl 拼音王国 欢迎来到 大家好, 恭喜你们成为小学生。 我是你们的好朋友朵朵, 我们一起去拼音王国吧,
语文天地.
香港. 香港 cuǐ càn * 24 香港,璀璨的明珠 cuǐ càn * 24 香港,璀璨的明珠.
【B项“葩”读pā;C项“熨”读yù;D项“饬”读chì】
契約 課程:文書實務與應用 教師:黃湃翔老師.
记念刘和珍君.
Fuzzy在生活上的應用 陳詩豐 助理教授 龍華科技大學機械系.
客家語拼音教學 (四縣腔) 分享者:馮美齡.
1 Introduction Prof. Lin-Shan Lee TA: Chun-Hsuan Wang.
1 Introduction Prof. Lin-Shan Lee.
西师大版语文五年级上册第七单元 心田上的百合花.
奢侈稅成效分析與房市未來發展 吳中書 中華經濟研究院 第十九屆亞太財務經濟會計及管理會議 ~07.09.
A Study on the Next Generation Automatic Speech Recognition -- Phase 2
苏教版三年级语文下册第三单元 李广射虎.
记念刘和珍君 鲁迅.
童年:童年是七彩的梦/伴我在床头玩耍/童年是弯弯的小船,载我在知识的海洋里遨游/童年是快乐的小鸟,张开翅膀/携我在自由的蓝天上飞翔/ 现在呵,童年却是—枚小小的铃铛/不管春与夏、秋与冬/永在我记忆深处/放声歌唱……
《堂吉诃德》是西班牙伟大的作家塞万提斯的代表作,也是一部脍炙人口的世界名著,是欧洲长篇小说发展史上的一座里程碑。本书一方面针砭时弊,揭露批判社会的丑恶现象,一方面赞扬除暴安良、惩恶扬善、扶贫济弱等优良品德,所有这些,都是人类共同的情感,它可以穿越时空,对每个时代、每个民族都具有永恒的价值,在相隔四个世纪之后,仍感动着每一个读者。
社戏 鲁迅.
月光曲.
1 Introduction Prof. Lin-Shan Lee.
专 业: 信号与信息处理 学生姓名: 杜 兰 任课老师: 高新波 二零零二年十二月
人骨法器.
4月电商补充活动 执行手册 2016年4月 别克事业部.
第三章 音樂檢索技術 1) 內涵式音樂資訊檢索(content-based music information retrieval)
下列各句没有语病的一项是 A.布什政府在陷入伊战泥潭不能自拔的情况下,美国国会通过决议要求政府限期从伊拉克撤军。 B.自上世纪70年代开始,心脏病急剧上升,该病已成为威胁人类健康的主要杀手之一。 C.尊重事实,追求真理是专家的天职,任何违背科学真理的行为都应成为其禁区都不可踏入。 D.北京时间2007年9月14日,9时33分,日本第一颗绕月探测卫星“月亮女神”号在日本九州种子岛宇宙中心发射升空。
臺灣各地名產.
原版:清大資工系 張智星 新增版:方煒 台大生機系
冬日课件制作 田东四中:陆梅冬 2006年3月19日.
香港八日草 出處:擬古(散文集) 背景:為接受香港翻譯學會頒贈榮譽會士銜,短暫停留香港期間,得到許多見聞及感思。
第一课 你 好 dì yī kè   nǐ hǎo.
1.小蝌蚪找妈妈 liǎnɡ jīnɡ 睛(眼睛)(点睛) 两(两个)(两人)(两半) (目不转睛) jiù 就(就是)(成就)(就地)
1、 春 夏 秋 冬 一、会认的字 shuāng chuī luò jiàng piāo yóu chí
Presentation transcript:

關鍵詞辨認 (Keyword Spotting) 張智星 Jang@cs.nthu.edu.tw http://www.cs.nthu.edu.tw/~jang

自我介紹 學歷 研究重點 經歷 1980-84: 台大電機系 1992-93:研究員,電機電腦系、加州大學柏克萊分校 1987-92:電機電腦(EECS)博士、美國加州大學柏克萊分校(指導教授:Prof. Lotfi Zadeh, Father of Fuzzy Logic) 研究重點 Speech/Melody Recognition, Neural Networks, Fuzzy Logic 經歷 1992-93:研究員,電機電腦系、加州大學柏克萊分校 1993-95:應用工程師,美國麻州 MathWorks 公司(MATLAB總公司),完成 Fuzzy Logic Toolbox 1995-至今:副教授,清華大學資訊系

大綱 何謂「關鍵詞辨認」? 「關鍵詞辨認」的應用面 「關鍵詞辨認」的方法 展示與結論 輸入的前處理(Query processing) 語料的斷句(Sentence segmentation) 自由音節解碼(Free syllable decoding) 相似度比對(Similarity computation) 展示與結論

何謂「關鍵詞辨認」? 關鍵詞辨認:從大量的錄音資料中,以電腦自動搜尋含有某個特定關鍵詞的語音資料 類別 關鍵詞範圍 輸入模式 固定(Fixed set) 不固定(Open set) 輸入模式 文字輸入(Text query) 語音輸入(Speech query)

「關鍵詞辨認」的應用面 語音資料的自動檢索(例如新聞廣播、運動轉播、錄影帶搜尋) 電話自動監聽系統 電話總機語音轉接系統

1. 輸入的前處理 文字輸入 語音輸入 範例 標注音(Syllable labeling) 自由音節解碼(Free syllable decoding) 音節擴展(Syllable expansion) 範例 奧斯卡  au-sii-ka  ou-sii-ka au-shii-ka au-sii-da

2. 語料的斷句 Silence-detection-based segmentation Uniform segmentation with overlap

3. 自由音節解碼 目的 使用 Viterbi decoding 將語音輸入轉換成最可能的國語音節(若不包含聲調,國語共約有408個不同音節) 特性 辨識率不高(大約 50~60%) 錯誤類別:Substitution, insertion and deletion.

3. 自由音節解碼(cont.) 範例: 一般民眾都關切宋楚瑜的下一步會怎麼走 pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chu-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cng-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chun-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chu-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cng-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cu-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chun-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cun-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cu-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cun-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chu-mu-cor

4. 相似度比對 音節字串的各種比對方法 Longest common subsequence Longest consecutive common subsequence Weighted sum between initials and finals Confusion table based weighting

效能評估 兩種評估方式 特性:兩者不可得兼! 錯誤的接受(False acceptance):錯誤地接受不含關鍵詞的語音資料 錯誤的拒絕(False rejection):錯誤地拒絕含有關鍵詞的語音資料 特性:兩者不可得兼!

測試資料與相關效能 測試語音資料 效能(score threshold=5) 17人(14男3女),每人錄音75句新聞標題,共有 1275句子 實驗室錄音環境,以 PC 麥克風錄音(16KHz, 8-bit resolution) 效能(score threshold=5) False acceptance: 10% (90% true acceptance) False rejection: 27% (73% true rejection)

預期的速度改進 自由音節解碼 60分鐘的語料,只需要6分鐘來解碼 相似度比對 60分鐘的語料,轉換成音節字串後,只需要1秒來計算相似度

電話語音的效能考量 針對電話語音的效能提升 預期效能 Channel compensation 使用電話語料所訓練出來的 HMM 參數 Cepstral mean normalization Signal bias removal Stochastic matching 使用電話語料所訓練出來的 HMM 參數 預期效能 10% false acceptance (90% true acceptance) 20% false rejection (80% true rejection)

系統展示 展示一: 唐詩三百首的語音辨識 人名的語音辨識 展示二:關鍵詞辨認 非固定關鍵詞 文字輸入