關鍵詞辨認（Keyword Spotting）

Slides:

Advertisements

Similar presentations

渡黑水溝郁永河. 2 戎克船：是明末清初時期往返兩岸的主要交通工具 ∗ 1. 關於台灣的開發歷史，我們到底了解多少呢？不妨試著說出就我們所知有關台灣開發史的故事、小說、電影、音樂與大家分享。 ∗ 2. 什麼是黑水溝？黑水溝為什麼會成為大陸移民渡海來臺時最大的威脅？ ∗ 3. 有聽過「六死三留一回頭」、「有唐山公，無唐山嬤」這兩.

Advertisements

三年级语文下册知识汇总.

兵车行杜甫福州十一中语文组林嵘臻.

成才之路 · 语文中国现代诗歌散文欣赏路漫漫其修远兮吾将上下而求索.

两汉文学及汉代诗歌.

高一（10）班化学研究性学习报告研究课题：能源调查指导老师：谢渊制作人：参与调查人人：谢渊、姜波、陈康、黄伟康、许思琪、王彪.

近现代文学概说.

沉痛悼念郭可信院士.

牛汉 ——《华南虎》 …… 恍惚之中听见一声石破天惊的咆哮，有一个不羁的灵魂掠过我的头顶腾空而去，我看见了火焰般的斑纹

牛汉 …… 恍惚之中听见一声石破天惊的咆哮，有一个不羁的灵魂掠过我的头顶腾空而去，我看见了火焰似的斑纹火焰似的眼睛，

综合实践活动设计与实践案例 ——《感恩父母》主题班会.

热爱党、热爱祖国、热爱人民泉州九中初二年（10）班主题班会.

　　厦门市诗坂中学陈苑然.

高一语文必修1 基础知识复习专题.

译书尚未成功，惊闻殒星，中国何人领呐喊；

中小企业融资担保业务交流主讲人陈冠宇.

赤壁赋苏轼.

12* 假如没有灰尘.

逻辑学主讲：李贤军.

开卷有益成考语文复习.

片段背诵第9课说“木叶” 晨读新课启航资料助读第三单元识记知识必备主旨概览探究文本研读文本层析写法借鉴

内容提要全文朗诵随文注释整篇翻译重点提示参考文献自测练习不失人情论李中梓课件制作：上海中医药大学医古文教研室王兴伊.

灵枢·本神第八主讲人王洪京.

21、水乡歌团结和平中心学校李团乐.

第五单元群星闪耀复法指导阅读与欣赏单元重点 1.了解传记文的基本体例与特征。

第五章菜单管理一、菜单的定义菜单是饭店餐厅提供商品的目录。是餐厅餐饮产品销售的品种、说明和价格的一览表，在餐

招商项目推介书中科电工.

第三章菜单的设计与制作第一节菜单的重要性第二节菜单的种类及其特点第三节菜单的设计与制作.

我用灵动的声音、奇异的形体和清透的心灵向你诉说，不知道你是否读懂了我———雨的心曲？

Fuzzy系統陳詩豐助理教授龍華科技大學機械系.

季羡林，山东聊城人，字希逋，又字齐奘。国际著名东方学大师、语言学家、文学家、国学家、佛学家、史学家、教育家和社会活动家。历任北京大学副校长、中国社会科学院南亚研究所所长，是北京大学的终身教授。早年留学国外，通英、德、梵、巴利文，能阅俄、法文，尤精于吐火罗文，是世界上仅有的精于此语言的几位学者之一。为“梵学、佛学、吐火罗文研究并举，中国文学、比较文学、文艺理论研究齐飞”，其著作汇编成《季羡林文集》，共24卷。生前曾撰文三辞桂冠：国学大师、学界泰斗、国宝。

第十九课南吕•一枝花不伏老关汉卿.

女排，中国的骄傲.

研究生：鍾哲民指導教授：王宗一報告者：林谷霖課程指導：蘇德仁

鸿门宴司马迁.

dtnl 拼音王国欢迎来到大家好，恭喜你们成为小学生。我是你们的好朋友朵朵，我们一起去拼音王国吧，

香港. 香港 cuǐ càn * 24 香港，璀璨的明珠 cuǐ càn * 24 香港，璀璨的明珠.

【B项“葩”读pā；C项“熨”读yù；D项“饬”读chì】

契約課程：文書實務與應用教師：黃湃翔老師.

记念刘和珍君.

Fuzzy在生活上的應用陳詩豐助理教授龍華科技大學機械系.

客家語拼音教學 (四縣腔) 分享者:馮美齡.

1 Introduction Prof. Lin-Shan Lee TA: Chun-Hsuan Wang.

1 Introduction Prof. Lin-Shan Lee.

西师大版语文五年级上册第七单元心田上的百合花.

奢侈稅成效分析與房市未來發展吳中書中華經濟研究院第十九屆亞太財務經濟會計及管理會議 ~07.09.

A Study on the Next Generation Automatic Speech Recognition -- Phase 2

苏教版三年级语文下册第三单元李广射虎.

记念刘和珍君鲁迅.

童年：童年是七彩的梦/伴我在床头玩耍／童年是弯弯的小船，载我在知识的海洋里遨游/童年是快乐的小鸟，张开翅膀／携我在自由的蓝天上飞翔/ 现在呵，童年却是—枚小小的铃铛／不管春与夏、秋与冬／永在我记忆深处／放声歌唱……

《堂吉诃德》是西班牙伟大的作家塞万提斯的代表作，也是一部脍炙人口的世界名著，是欧洲长篇小说发展史上的一座里程碑。本书一方面针砭时弊，揭露批判社会的丑恶现象，一方面赞扬除暴安良、惩恶扬善、扶贫济弱等优良品德，所有这些，都是人类共同的情感，它可以穿越时空，对每个时代、每个民族都具有永恒的价值，在相隔四个世纪之后，仍感动着每一个读者。

1 Introduction Prof. Lin-Shan Lee.

专业: 信号与信息处理学生姓名：杜兰任课老师：高新波二零零二年十二月

4月电商补充活动执行手册 2016年4月别克事业部.

第三章音樂檢索技術 1) 內涵式音樂資訊檢索(content-based music information retrieval)

下列各句没有语病的一项是 A．布什政府在陷入伊战泥潭不能自拔的情况下，美国国会通过决议要求政府限期从伊拉克撤军。 B．自上世纪70年代开始，心脏病急剧上升，该病已成为威胁人类健康的主要杀手之一。 C．尊重事实，追求真理是专家的天职，任何违背科学真理的行为都应成为其禁区都不可踏入。 D．北京时间2007年9月14日，9时33分，日本第一颗绕月探测卫星“月亮女神”号在日本九州种子岛宇宙中心发射升空。

臺灣各地名產.

原版：清大資工系張智星新增版：方煒台大生機系

冬日课件制作田东四中：陆梅冬 2006年3月19日.

香港八日草出處：擬古（散文集）背景：為接受香港翻譯學會頒贈榮譽會士銜，短暫停留香港期間，得到許多見聞及感思。

第一课你好 dì yī kè 　　nǐ hǎo.

1.小蝌蚪找妈妈 liǎnɡ jīnɡ 睛（眼睛）（点睛）两（两个）（两人）（两半）（目不转睛） jiù 就（就是）（成就）（就地）

1、春夏秋冬一、会认的字 shuāng chuī luò jiàng piāo yóu chí

Presentation transcript:

關鍵詞辨認（Keyword Spotting）張智星 Jang@cs.nthu.edu.tw http://www.cs.nthu.edu.tw/~jang

自我介紹學歷研究重點經歷 1980-84: 台大電機系 1992-93：研究員，電機電腦系、加州大學柏克萊分校 1987-92:電機電腦（EECS）博士、美國加州大學柏克萊分校（指導教授：Prof. Lotfi Zadeh, Father of Fuzzy Logic）研究重點 Speech/Melody Recognition, Neural Networks, Fuzzy Logic 經歷 1992-93：研究員，電機電腦系、加州大學柏克萊分校 1993-95：應用工程師，美國麻州 MathWorks 公司（MATLAB總公司），完成 Fuzzy Logic Toolbox 1995-至今：副教授，清華大學資訊系

大綱何謂「關鍵詞辨認」？「關鍵詞辨認」的應用面「關鍵詞辨認」的方法展示與結論輸入的前處理（Query processing）語料的斷句（Sentence segmentation）自由音節解碼（Free syllable decoding）相似度比對（Similarity computation）展示與結論

何謂「關鍵詞辨認」？關鍵詞辨認：從大量的錄音資料中，以電腦自動搜尋含有某個特定關鍵詞的語音資料類別關鍵詞範圍輸入模式固定（Fixed set）不固定（Open set）輸入模式文字輸入（Text query）語音輸入（Speech query）

「關鍵詞辨認」的應用面語音資料的自動檢索（例如新聞廣播、運動轉播、錄影帶搜尋）電話自動監聽系統電話總機語音轉接系統

1. 輸入的前處理文字輸入語音輸入範例標注音（Syllable labeling）自由音節解碼（Free syllable decoding）音節擴展（Syllable expansion）範例奧斯卡  au-sii-ka  ou-sii-ka au-shii-ka au-sii-da

2. 語料的斷句 Silence-detection-based segmentation Uniform segmentation with overlap

3. 自由音節解碼目的使用 Viterbi decoding 將語音輸入轉換成最可能的國語音節（若不包含聲調，國語共約有408個不同音節）特性辨識率不高（大約 50~60%）錯誤類別：Substitution, insertion and deletion.

3. 自由音節解碼（cont.）範例：一般民眾都關切宋楚瑜的下一步會怎麼走 pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chu-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cng-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chun-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chu-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cng-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cu-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chun-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cun-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cu-mu-chng ti-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-cun-mu-chng pi-ban-ni-ciong-dor-guan-ti-song-tun-di-ciang-bu-huei-chu-mu-cor

4. 相似度比對音節字串的各種比對方法 Longest common subsequence Longest consecutive common subsequence Weighted sum between initials and finals Confusion table based weighting

效能評估兩種評估方式特性：兩者不可得兼！錯誤的接受（False acceptance）：錯誤地接受不含關鍵詞的語音資料錯誤的拒絕（False rejection）：錯誤地拒絕含有關鍵詞的語音資料特性：兩者不可得兼！

測試資料與相關效能測試語音資料效能（score threshold=5） 17人（14男3女），每人錄音75句新聞標題，共有 1275句子實驗室錄音環境，以 PC 麥克風錄音（16KHz, 8-bit resolution）效能（score threshold=5） False acceptance: 10% (90% true acceptance) False rejection: 27% (73% true rejection)

預期的速度改進自由音節解碼 60分鐘的語料，只需要6分鐘來解碼相似度比對 60分鐘的語料，轉換成音節字串後，只需要1秒來計算相似度

電話語音的效能考量針對電話語音的效能提升預期效能 Channel compensation 使用電話語料所訓練出來的 HMM 參數 Cepstral mean normalization Signal bias removal Stochastic matching 使用電話語料所訓練出來的 HMM 參數預期效能 10% false acceptance (90% true acceptance) 20% false rejection (80% true rejection)

系統展示展示一：唐詩三百首的語音辨識人名的語音辨識展示二：關鍵詞辨認非固定關鍵詞文字輸入