上海交通大学计算机系 吴亚栋 E-mail:ydwu@mail.sjtu.edu.cn Tel: 62932057 语音识别基础 第五章 基于统计模型(HMM)方式 的语音识别技术 上海交通大学计算机系 吴亚栋 E-mail:ydwu@mail.sjtu.edu.cn Tel: 62932057.

Slides:



Advertisements
Similar presentations
1 践行三严三实 深化作风建设 中共广东省委党校 刘朋 年 3 月 9 日,习近平总书记 在十二届全国人大二次会议安 徽代表团参加审议时,在关于 推进作风建设的讲话中,提到 “ 既严以修身、严以用权、严以 律己,又谋事要实、创业要实 、做人要实 ” 的重要论述,称为 “ 三严三实 ”
Advertisements

林雪卿 (厦门城市职业学院教育系) Tel : ; 与教师有关的法规: 1 、《中华人民共和国教师法》 2 、《教师资格条例》 3 、福建省实施《中华人民共和国教师法》办法 4 、厦门市实施《中华人民共和国教师法》若干规 定 5 、关于《中华人民共和国教师法》若干问题的实.
“ 你不仅要关心自己的盘子装的是什么食物,而 且更要关心每种食物的最佳进食时间! ” 这是英 国剑桥大学营养专家提出的最新健康饮食法则! 这是因为,食物也有自己的 “ 生物钟 ” , 只有遵 从它,你才能吃得更健康和苗条! 如果去吃自助餐,你会怎么做呢?先吃鱼肉大 菜,吃到差不多再吃蔬菜、主食,然后喝汤、
“ 你不僅要關心自己的盤子裝的是什麼食物,而 且更要關心每種食物的最佳進食時間! ” 這是英 國劍橋大學營養專家提出的最新健康飲食法則! 這是因為,食物也有自己的 “ 生物鐘 ” , 只有遵 從它,你才能吃得更健康和苗條! 如果去吃自助餐,你會怎麼做呢?先吃魚肉大 菜,吃到差不多再吃蔬菜、主食,然後喝湯、
五年級上學期的自然課,當我們上到水溶液單元時,老師指導我們石蕊試紙可以測試水溶液的酸鹼性,藍色石蕊試紙遇鹼性 水溶液不變色,遇酸性水溶液時變紅色;而紅色石蕊試紙遇鹼性水溶液變藍色,遇酸性水溶液時不變色。 可是,滴入醋水溶液的藍色石蕊試紙變紅色的部分竟然消失不見了,紅色石蕊試紙應該不變色卻出現藍紫色,怎麼會這樣呢?
茶叶基本知识 徐南眉. 中国是茶树的原产地,中国古代劳动人民 最早发现了茶、利用了茶,世界上其他国 家是从中国引入了茶树和制茶、饮茶的方 法,茶是中国古代劳动人民奉献给世界人 民的健康饮料。茶从最初的药用到饮用, 从煎煮饮用到现代沏茶品茶经历了漫长的 历史发展过程。在世界的东方,茶不但是 饮料,还包含着丰富的精神文化内容。
防腐剂、矫味剂、着色剂. 同学们仔细看看双黄连口服液、甘草合剂等液体制剂说明 书中【成分】一项包括那些? 2 .大家想想芬达葡萄糖汽水配料中都有什么? 说明书中是不是经常会看到蔗糖、糖精钠、 苯甲酸钠、柠檬黄、羟苯乙酯等物质的出 现。这些东西到底是起什么作用的了?大 部分液体药剂的溶剂多用水,以水为溶剂.
科学就医健康教育核心信息 健康中国行·科学就医 一、倡导科学就医 二、遵从分级诊疗 三、定期健康体检 四、鼓励预约挂号 五、就医注意事项
★中国近代史: 1840年————1949年 鸦片战争 新中国诞生 ★历史线索: 1、资本主义列强对中国的侵略 2、中国人民的反抗和探索:
郝京华 博士 南京师范大学教育科学组教授 小学科学课标研制者组长 苏教版小学科学教材主编
化學期末報告–人體的酸鹼平衡 工作分配: 組別:第5組 班級:自控一甲 組長:4A012134羅振元
第十五章 控制方法.
改名台南大學實地訪視簡報
1. 福康安紀功碑 2. 丙午震災紀念碑 3. 十二門古砲 4. 陳澄波畫架 5. 牆之道 6. 一江山紀念碑 7. 孔廟
中国职工保险互助会北京办事处 业务管理系统
郑伟诗 Wei-Shi Jason Zheng
化工科簡介 歡迎新夥伴加入化工行列.
典例之二 我国第—个生态县——大丰生态县的建设
第十二章 就业常用文书 概 述 在日本,学生从“就活”(しゅうかつ)找工作,到参加公司的“入社式”(にゅうしゃしき),要经过一个漫长的过程。这期间要进行许多有关的活动,这些活动都避免不了要书写各种文书材料。 本章大致按先后的顺序,就学生就业常用文书加以分析介绍。
健行科技大學103學年度 大一新生 心理健康紅綠燈 諮商輔導組製.
手太阳小肠经.
常见肌肉骨骼疾患的康复治疗.
小班早期阅读讲座.
面点工艺学 胜利职业学院建设分院 赵晓晖 Tel:
徐邦桃 新课程理念下的说课 单位:苏州高新区通安中学 Tel:
主讲:张 勇 TEL: 文秘管理与写作 主讲:张 勇 TEL:
概率图模型 林琛 博士、副教授.
財團法人任兆璋修女林美智老師教育基金會 任兆璋 口述
水 与 生命.
游泳四式技術分析暨初級教法.
依法规范教育行为 维护师生合法权益 陈全英 (宁波教育学院教育管理分院)
愛的學習 懷仁全人發展中心 任兆璋 口述 財團法人任兆璋修女林美智老師教育基金會 TEL:
党务工作知识 西安市委党校党史党建部 程平安
预防颈椎病我们 有办法 泉河街道社区卫生服务中心 周秀兰 Tel:
企业所得税纳税申报操作指南 主讲人 赵凯 山西省财政税务专科学校财政系副主任 山西恒信智达财税咨询有限公司总经理
學校:光春國中 班級:七年三班 製作團隊: 顏序芳 李邰岳 謝宜軒
親 師 溝 通 緊急連絡網的建立 學生及家長基本資料的建立 班親會、親師懇談會、學校日、教學參觀日、家庭訪問 連絡簿的運用
高等学校实验室信息系统 的使用及指标体系说明
98學年度申請入學新生報到 臺北市立士林高商《商業管理群》    商業經營科    會計事務科    國際貿易科    簡介.
小学数学教育质量监测命题的路径与方法 彭晓玫
解放軍論壇 中共信息戰發展 對我國軍事戰略之影響.
餐饮产品设计 与活动打造 南京旅游职业学院 邵万宽 Tel:
高等学校实验室信息系统 的使用及指标体系说明
安徽省总工会干部学校 张 举 TEL: 工会基本理论 安徽省总工会干部学校 张 举 TEL:
2013税收专项检查辅导 池州市地方税务局稽查局 查茂松 TEL: ( )
专题五 高瞻远瞩 把握未来 ——信息化战争 主讲教师:.
任修女的親子學堂 財團法人任兆璋修女林美智老師教育基金會 TEL:
《社会保险法》 与医疗工伤生育保险 ——人社局 蔡正权.
第十章 现代秘书协调工作.
食物中毒及预防.
打造高效课堂的有效策略 宁乡县教师进修学校 刘志军.
第七章财产清查 主讲:马国芬 副教授 江西财大会计学院 TEL:0791——
农村中小学体育教育教学 存在的有关问题与对策
与奥运同行 豫章中学 余敏.
程序的形式验证 - 简介 中国科学院软件研究所 张文辉 1.
隐马尔可夫模型 Hidden Markov model
隐马尔可夫模型 Hidden Markov model
优化模型 1 存贮模型 配件厂为装配线生产若干种产品,轮换产品时因更换设 备要付生产准备费,产量大于需求时要付贮存费。该厂
期望值 機率概念與應用網路學習研究.
词性标注与隐马尔可夫模型 戴新宇
隐马尔可夫模型 Hidden Markov model
2015 年勞動部勞動力發展署雲嘉南分署 全國自走車競速大賽
Bioelectromagnetics Key Laboratory, College of Medicine
义务教育课程标准(2011版) 省级研训报告会 《化学课程标准》解读 主讲人: 崔敏 陕西省教育厅.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
隐马尔可夫模型简介 X1 X2 XT ………… O1 O2 OT 刘群
难点:连续变量函数分布与二维连续变量分布
隐马尔可夫模型 Hidden Markov model
三、 动量和角动量 1 、 质点动量定理 动量 冲量.
Presentation transcript:

上海交通大学计算机系 吴亚栋 E-mail:ydwu@mail.sjtu.edu.cn Tel: 62932057 语音识别基础 第五章 基于统计模型(HMM)方式 的语音识别技术 上海交通大学计算机系 吴亚栋 E-mail:ydwu@mail.sjtu.edu.cn Tel: 62932057

第五章 基于统计模型(HMM)方式 的语音识别技术 5.1 基于统计模型框架的识别法* 5.2 隐马尔柯夫模型(HMM)的概念* (HMM:Hidden Markov Models) 5.3 HMM的三个基本问题* 5.4 基于HMM的语音识别方案*

第五章 回家作业 提交时间:

5.1 基于统计模型框架的识别法 5.1.1 预备知识 5.1.2 基于统计模型框架的识别法* (1)条件概率 P(A|B) P(A|B) = P(A,B)/P(B) P(A,B):表示A与B的联合概率。 (2)Bayes定理 P(A|B) = P(B|A)P(A)/P(B) (3)事件的独立性 P(A,B) = P(A)P(B) 5.1.2 基于统计模型框架的识别法*

5.2 隐马尔柯夫模型(HMM)的概念 5.2.1 马尔柯夫过程* 5.2.2 隐马尔柯夫模型的概念* 的生成方式*

5.3 HMM的三个基本问题及其解法 5.3.1 HMM三个基本问题 5.3.2 模型评估问题的解法* 5.3.3 最佳路径问题的解法* - 模型评估问题(如何求:P(O|λ)) - 最佳路径问题(如何求:Q=q1q2…qT) - 模型训练问题(如何求:A 、B 、π) 5.3.2 模型评估问题的解法* 5.3.3 最佳路径问题的解法* 5.3.4 模型训练问题的解法

5.4 基于HMM的语音识别方案 · · HMM(3) HMM(2) 语音信号输入 预处理 码本 HMM(1) 训练 X O 声学参数分析 VQ · VITERBI 计算 识别 X:特征矢量的时间序列 O:基于VQ的观察符号序列 判决规则

基于统计模型框架的识别法(1) 语音识别问题的形式化描述 -设:(1)待识语音的特征模式:T =t1,t2,…, tI (2)词汇表中第n个单词:W(n), 1≤n≤N (3)当T 被观察到后,与T 对应的发声内容是 单词 W(n)的概率: P( W(n)|T ) -语音识别问题的形式化描述: k = argmax{ P( W(n)|T ) } n

基于统计模型框架的识别法(2) P(W(n)|T )= P(T |W(n))P(W(n))/P(T ) 声学模型与语言模型 k = argmax{P(T |W(n)) · P(W(n))} n 模式匹配与统计模型(T :待识语音) 模式匹配 统计模型 词 汇 表 W(k), 1≤k≤N 词 汇 表 W(k), 1≤k≤N 参考模式 R(k), 1≤k≤N 参考模型 M(k), 1≤k≤N 失真侧度 Dk = D(T,R(k)) 概率侧度 P(T|M(k)) -Dk:DTW距离 -P: 由M(k)生成T 的概率 判 别 n = argmin{Dk} 判 别 n=argmax{P(T|M(k))} 1≤k≤N 1≤k≤N 识别结果 W(n) 识别结果 W(n) 声学模型 语言模型

马尔柯夫过程 语言的马尔柯夫模型 P(Ci,Cj) = P(Ci)P(Cj|Ci) P(Ci,Cj,Ck) Cl P(Cj | Ci) P(Ck | Cj) P(Cl | Ci) 一阶马尔柯夫过程 语言的马尔柯夫模型 P(Ci,Cj) = P(Ci)P(Cj|Ci) P(Ci,Cj,Ck) = P(Ci)P(Cj|Ci)P(Ck|Cj) 天气的马尔柯夫模型 观察日期: 1 2 3 4 5 6 7 8 观察序列(O): 晴晴晴雨雨晴多云晴 状态转移序列:3 3 3 1 1 3 2 3 状态输出概率P(O|λ): P(O|λ) = P(3,3,3,1,1,3,2,3 |λ) = P(3)P(3|3)P(3|3)P(1|3) P(1|1)P(3|1)P(2|3)P(3|2) 天气的马尔柯夫模型 0.4 0.6 0.8 0.2 0.1 0.3 1: 多云 3: 晴天 初始状态 P(3)=1.0 2: 雨天

隐马尔柯夫模型的概念 双重随机过程 - 依存于状态的观察事件的随机性 - 状态转移的随机性 观察序列(H:正面;T:反面): O={o1,o2,…,oT} H,H,T,…,T 1-a11 1-a22 a22 a11 P(H) = P2 P(H) = P1 P(T) = 1-P1 P(T) = 1-P2 1 2 硬币投掷试验模型

HMM模型的要素及其模型描述 模型要素: 模型描述: λ=(A, B, π) (1)N:模型中的状态数目 (3)A = {aij}:状态转移概率分布 (4)B = {bj(k)}:观察符号的概率分布 (5)π= {πi}:初始状态概率分布 模型描述: λ=(A, B, π)

基于HMM的观察符号序列的生成方式 当给定模型λ(A, B,π)后,就可将该模型看成 一个符号生成器(或称信号源),由它生成观察 序列 O= o1o2 … oT。其生成过程(也称HMM过程)是: (1)初始状态概率分布π,随机选择一个初始状态 q1 = Si; (2)置 t = 1; (3)按状态 Si 的符号概率分布bi(k),随机产生一个输出符号 ot = Vk; (4)按状态 Si 的状态转移概率分布aij,随机转移至一个新的状态 qt+1 = Sj (5)令t = t + 1,若 t≤ T,则返回步骤(3),否则结束过程。

[ ] 模型评估问题的解法(1) a b HMM 模型的例子 观察符号序列:abba 所有可能的路径: (1) S1-S1-S1-S2-S3 0.2 0.5 1.0 0.8 a b S1 S2 S3 0.6 0.4 [ ] 模型评估问题的解法(1) 当给定模型λ(A, B,π)以及观察序列 O =o1o2…oT时,计算模型λ对观察序列 O 的 P(O|λ)概率的思路是(穷举法): (1)对长度为T 的观察序列O,找出所有 可能产生该观察序列O 的状态转移序 列 Qj =qj1 qj2 qj3 …qjT(j=1,2,…,J); (2)分别计算Qj与观察序列O 的联合概率 P(O, Qj|λ); (2)取各联合概率P(O,Qj|λ)的和,即: J P(O|λ)=∑P(O,Qj|λ) j=1 HMM 模型的例子 观察符号序列:abba 所有可能的路径: (1) S1-S1-S1-S2-S3 (2) S1-S1-S2-S2-S3 (3) S1-S1-S2-S3-S3 (4) S1-S2-S2-S2-S3 (5) S1-S2-S2-S3-S3 (6) S1-S2-S3-S3-S3

[ ] 模型评估问题的解法(2) a b HMM 模型的例子 0.2 0.5 1.0 0.8 S1 S2 S3 0.6 0.4 P(O|λ)的一般解法: ∵ P(O,Qj|λ)= P(Qj|λ)P(O|Qj,λ) P(Qj|λ)= P(qj1)P(qj2|qj1)P(qj3|qj2) … P(qjT-1|qjT) = aj0,1 aj1,2 aj2,3 …ajT-1,T P(O|Qj,λ)= P(o1|qj1)P(o2|qj2) … P(oT|qjT) = b1j(o1) b2j(o2) b3j(o3) … bTj(oT) ∴ P(O,Qj|λ) = aj0,1b1j(o1) aj1,2 b2j(o2) … ajT-1,T bTj(oT) J J T P(O|λ)=∑P(O,Qj|λ)=∑{∏ ajt,tbtj(ot) } j=1 j=1 t=1 HMM 模型的例子

[ ] 模型评估问题的前向算法 a b Q: q1 q2 q3 q4 O: a b b a t 0.2 0.5 1.0 0.8 a b S1 S2 S3 0.6 0.4 [ ] 模型评估问题的前向算法 Q: q1 q2 q3 q4 O: a b b a t 1.0 0.0 0.1 0.4 0.01 0.12 0.08 0.001 0.028 0.088 0.0001 0.0088 0.0260 S1 S2 S3 0.5x0.2 0.5x0.8 0.2x1.0 0.6x0.5 0.4x0.5 0.8x1.0 采用前向算法求解P(abba|λ)概率的格型图

[ ] 最佳路径问题的解法 a b 最佳路径:S1-S2-S3-S3-S3 Q: q1 q2 q3 q4 O: a b b a t 0.2 0.5 1.0 0.8 a b S1 S2 S3 0.6 0.4 [ ] 最佳路径问题的解法 最佳路径:S1-S2-S3-S3-S3 Q: q1 q2 q3 q4 O: a b b a t 0.5x0.2 0.5x0.2 0.5x0.2 0.5x0.2 S1 S2 S3 1.0 0.0 0.1 0.4 0.0 0.01 0.08 0.001 0.016 0.064 0.0001 0.0088 0.0128 0.5x0.8 0.5x0.8 0.5x0.8 0.5x0.8 0.6x0.5 0.4x0.5 0.4x0.5 0.6x0.5 0.6x0.5 0.4x0.5 0.4x0.5 0.4x0.5 0.2x1.0 0.8x1.0 0.8x1.0 0.2x1.0 采用Viterbi算法求解产生观察 序列abba最佳路径的格型图