基於聯合因子分析與麥克風陣列之強健性語音辨認

Slides:



Advertisements
Similar presentations
5·20 学生营养日 勤工办 学生营养日来历 1989 年成立的中国学生营养促进会在营养学家于 若木的主持下,结合世界卫生组织 2000 年人人享 有卫生保健的战略目标,制定了 1991 年至 2000 年 10 年学生营养工作计划。其中确定每年 5 月 20 日 为中国学生营养日。其目的在于广泛、深入宣传.
Advertisements

C A D C D.
大胆作为 勇于承担  建立安全监管新常态 市安全监管局 林凯军.
审核评估释义 余国江 教学质量监控与评估处.
食物安全計劃 — 刺身/壽司 訓練資料 食物安全中心.
外科护理学 沧州医学高等专科学校.
建筑与周边环境的和谐关系 建筑系 梁晓蕊
人教版PEP三年级英语下册 UNIT 3 How many?
愛情路上慢慢走 賴佳琳
我征服了黃山 林達的黃山之旅 2006春.
语文组:藏在泉州古巷中的美食 结题报告.
自信心训练教材 如何提高自己的自信心 -Jerrywang.
第二章 环境 Chapter 2 Environment.
沟通云平台 三三得玖通信技术有限公司 深圳市云屋科技有限公司 陈志伟
十五條佛規 後學:張慈幸
贵州分公司 工作总结报告 发起人: 山大鲁能.
整理者:建德市新安江第一小学 秦爱军 食品包装上的信息.
成都市现代制造职业技术学校 强抓职教师资建设 提升教师队伍素质 ——青年教师队伍长成记 主讲人:游 宏.
CIMC素质模型的建立 确定 绩效 标准 选取 分析 效标 样本 岗位 分类 获取 素质 数据 资料 整理 统计 验证 模型 重点介绍
消防安全教育 巫山县金银小学 马泮军.
九阳通过社会化媒体开卖面条机.
Mathematical Analysis 財金案例的應用
第五章 面试方法及应用.
道路交通管理 授课教师:于远亮.
第一章信託法 第一節 信託契約 第二節 信託財產 第三節 受益人 第四節 受託人 第五節 信託關係之消滅.
沟通 交流 合作 分享 2014届 6 班 学年下期家校共育交流会.
人民舆情数据库 讲解人:李晗.
Unit One My name's Gina..
数字健康医疗导论 课程作品汇报 医疗信息可视化课题研究 Medical information visualization.
特殊教育課程與教學調整現場實務 特教小組 執行秘書 林坤燦.
“笨人”创业法 广西英腾教育科技股份有限公司 董事长 兰涛.
小白兔愛跳舞,月夜光下學跳舞 時光一去不回,不要耽誤快快快 朋友們呀大家快來,不要耽誤快快快
逃出生天游戏介绍 胡永泽 高振卓 答辩人:.
翰林自然 六年級上學期 第二單元 聲音與樂器.
珠宝行业 市场部
国际商务谈判 山东财经大学 袁其刚 教授 Shandong Economics University
当一回消费者 泰安高新区北店子小学 刘清艳.
Unit 7 How much are these pants? Section A 3a-Section B 1b
報告人:丁英智 資策會 網路多媒體研究所 11/3/2006
Unit 10 Review and check.
学习报告 —语音转换(voice conversion)
极致清新·论文答辩 请填写论文副标题或补充内容 答辩学生:代用名 指导老师:代用名.
A Study on the Next Generation Automatic Speech Recognition -- Phase 2
dì yī kè wǒ ài wǒ jiā 第 一 课 我 爱 我 家 Lesson One I Love My Family
优尼科教育校园宣讲会 为了梦想,我们聚到了一起。 为了梦想,我们选择飞向远方。 南工程站.
The First Course in Speech Lab
闖關卡 恭喜你通過所有的考驗! 你是超級厲害的棒! 三年 班 號 姓名: 有色眼鏡 占心數 九九神功 你真棒! 神奇敲敲樂 魔陣密碼
國立臺北大學 National Taipei University Power Leader 社團精英幹部 培 訓 2012/12/11.
大学英语跨文化交际 ——中西教育文化差异 精神卫生学院 林丽菁
四川农业大学 第二十二期团校课程 第四讲:校团委日常公文与写作 主讲人:刘瀛锴.
使用工具优化无线远端关联 --- 《局域网组网技术》 安徽建设学校 汪双顶.
01 FISHBONE DIAGRAM TARGET PART ONE PART TWO PART THREE PART FOUR
Telephone Numbers詢問電話號碼
前言 本文主要以車牌(vehicle license plate)影像之不同大小、複雜環境背景以及不同天候的影像為分析對象,提出一套簡單與便利的車牌自動定位以及辨識技術。
IT行业工作汇报 PPT 模板  Annual Summary of IT Trade 汇报人:PPT研究院.
參考資料: 林秋燕 曾元顯 卜小蝶,Chap. 1、3 Chowdhury,Chap.9
創造不一樣的人生 -如何與身心障礙者接觸 新竹教育大學 薛明里.
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
Multiple Regression: Estimation and Hypothesis Testing
第三节 多重共线性的检验 本节基本内容: ● 简单相关系数检验法 ● 方差扩大(膨胀)因子法 ● 直观判断法 ● 逐步回归法.
闽教版小学英语第二册 Unit 4 Time partA 执教者:福清虎邱中心小学 翁爱珍.
The formation of the ordinary numbers
STEP THREE NO.1 点击此处添加标题 NO.5 点击此处添加标题 STEP FOUR STEP TWO
阿细蜜源代理系统功能说明 官方网站: 新版代理系统:
百分数 小数、分数.
可换成校徽 论文主标题 论文副标题 指导老师:X教授 答辩学生:宝藏PPT.
此处添加标题 汇报人:宝藏PPT.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
北京化工大学(昌平校区) 安全稳定工作方案 苏建茹 2019/05/09 主讲人 日期
96 教育部專案補助計畫案明細 單位 系所 教育部補助款 學校配合款 工作໨目 計畫主 持人 備註 設備費 業務費 579,000
Presentation transcript:

基於聯合因子分析與麥克風陣列之強健性語音辨認 Speaker: Wei-Te Fang & Hao-Cheng Chiang National Taipei University of Technology Professor: Yuan-Fu Liao

Overview Joint Factor Analysis (JFA) for Robust Speech Recognition Advanced Microphone Array and ASR Integration Noise - Phase Error Filtering Reverberation - Subband Filtering-and-Sum

Joint Factor Analysis (JFA) for Robust Speech Recognition National Taipei University of Technology Professor: Yuan-Fu Liao

Overview 1.Introduction 2. Joint Factor Analysis (JFA) 雜訊因素 傳統解決方法 2. Joint Factor Analysis (JFA) 數學模型 3.JFA for robust speech recognition Case1:環境,語者 Case2:環境,語者,說話內容 Case3:環境,語者,說話內容,語音屬性 4.Summary

Introduction 語音辨認系統干擾因素 強健性語音參數求取 先驗知識的調適語音模型 語者特性 雜訊環境 通道效應 測試環境和訓練環境不匹配 強健性語音參數求取 Mean subtraction, Variance normalization, ARMA filtering (MVA) Histogram Equalization (HEQ) 先驗知識的調適語音模型 Reference Model Weighting (RMW) Eigen-Maximum Likelihood Linear Regression (EMLLR) Reference Eigen-Environment and Speaker Weighting (RESW) Probabilistic principal component analysis-Maximun Likelihood Linear Regresstion (PMLLR)

JFA for Speaker Verification 常用的方法: UBM + GMM 古典MAP Eigen-voice Eigen-channel 語者空間 通道空間 語者相依 通道相依

JFA系統流程 Speaker model UBM model

Case1 :考慮環境,語者影響 JFA model表示: 語者空間 環境空間 語者相依 環境相依

JFA系統流程

實驗一 實驗設定 語料庫:Aurora2 語音內容: 加成性雜訊: one, two, three, four, five, six, seven, eight, nine, zero, oh 加成性雜訊: 地下鐵雜訊、人聲雜訊、汽車雜訊、展覽會館雜訊、餐廳雜訊、街道雜訊、機場雜訊及火車站雜訊 clean、SNR20 ~ -5 dB

JFA實驗設定 語者110人 雜訊28種 實驗維度設定 男生55、女生55 雜訊類型(N1~N4)*SNR(clean~ -5 dB) 語者55維、雜訊14維 語者55維、雜訊20維 語者55維、雜訊24維 語者60維、雜訊20維 語者70維、雜訊20維

JFA語者特徵空間投影圖 語者空間前置分析

JFA之雜訊特徵空間投影圖 雜訊空間前置分析

測試環境之綜合比較 測試環境效能比較

Case2 :考慮環境,語者,說話內容影響 環境空間 語者空間 說話內容空間 JFA model表示:(假設說話內容特徵空間為g,隱藏變數r(s)) 語者空間 環境空間 語者相依 環境相依 說話內容相依 說話內容空間

JFA系統流程 Estimate g

加入說話內容之概念 說話內容: oh,zero,one,two,three,four,five,six,seven,eight,nine 以oh ,zero ~ nine共11個音當作一個model 假設說話內容特徵空間為g,隱藏變數r(s),則 M (s)= m+ux (s)+vy(s)+gr(s)+dz(s) 加入特徵空間g變數估算方法同v,u,d算法

JFA之語音內容特徵空間投影圖 語音內容特徵空間投影圖之分析

實驗二之實驗結果 實驗設定 固定語者(S) 55維,語音內容(T) 6維,雜訊(N)14維、20維、24維 S 55、T 6、N 14 MVA 錯誤率 4.54 % 4.43 % 4.61 % 4.99%

Case3 :考慮環境,語者,說話內容,語音 屬性影響 以語音屬性內容為model做attribute detectors JFA model 表示:(假設語音屬性特徵空間為a,隱藏變數q(s)) 語者相依 環境相依 說話內容相依 語音屬性相依 語者空間 環境空間 說話內容空間 語音屬性空間

JFA系統流程 Estimate g Estimate a

加入語音屬性之概念 以語音屬性為單位當作一個model 加入特徵空間a變數估算方法同v,u,d,g算法

Automatic Speech Attribute Transcription (ASAT) N-Best Rescoring

Summary 實驗結果顯示,JFA方法優於其他系統。 可知正確考慮雜訊空間,即越接近實際雜訊情形,即可得到更正確之辨認結果。 未來JFA加入語音屬性之後,就可以實現robust speech attribute-based speech recognition。