基於聯合因子分析與麥克風陣列之強健性語音辨認

Slides:

Advertisements

Similar presentations

5·20 学生营养日勤工办学生营养日来历 1989 年成立的中国学生营养促进会在营养学家于若木的主持下，结合世界卫生组织 2000 年人人享有卫生保健的战略目标，制定了 1991 年至 2000 年 10 年学生营养工作计划。其中确定每年 5 月 20 日为中国学生营养日。其目的在于广泛、深入宣传.

Advertisements

大胆作为　勇于承担　建立安全监管新常态市安全监管局林凯军.

审核评估释义余国江教学质量监控与评估处.

食物安全計劃 — 刺身／壽司訓練資料食物安全中心.

外科护理学沧州医学高等专科学校.

建筑与周边环境的和谐关系建筑系梁晓蕊

人教版PEP三年级英语下册 UNIT 3 How many?

愛情路上慢慢走賴佳琳

我征服了黃山林達的黃山之旅 2006春.

语文组：藏在泉州古巷中的美食结题报告.

自信心训练教材如何提高自己的自信心 -Jerrywang.

第二章环境 Chapter 2 Environment.

沟通云平台三三得玖通信技术有限公司深圳市云屋科技有限公司陈志伟

十五條佛規後學：張慈幸

贵州分公司工作总结报告发起人：山大鲁能.

整理者：建德市新安江第一小学秦爱军食品包装上的信息.

成都市现代制造职业技术学校强抓职教师资建设提升教师队伍素质 ——青年教师队伍长成记主讲人：游宏.

CIMC素质模型的建立确定绩效标准选取分析效标样本岗位分类获取素质数据资料整理统计验证模型重点介绍

消防安全教育巫山县金银小学马泮军.

九阳通过社会化媒体开卖面条机.

Mathematical Analysis 財金案例的應用

第五章面试方法及应用.

道路交通管理授课教师：于远亮.

第一章信託法第一節信託契約第二節信託財產第三節受益人第四節受託人第五節信託關係之消滅.

沟通交流合作分享 2014届 6 班学年下期家校共育交流会.

人民舆情数据库讲解人：李晗.

Unit One My name's Gina..

数字健康医疗导论课程作品汇报医疗信息可视化课题研究 Medical information visualization.

特殊教育課程與教學調整現場實務特教小組執行秘書林坤燦.

“笨人”创业法广西英腾教育科技股份有限公司董事长兰涛.

小白兔愛跳舞,月夜光下學跳舞時光一去不回,不要耽誤快快快朋友們呀大家快來,不要耽誤快快快

逃出生天游戏介绍胡永泽高振卓答辩人：.

翰林自然六年級上學期第二單元聲音與樂器.

珠宝行业市场部

国际商务谈判山东财经大学袁其刚教授 Shandong Economics University

当一回消费者泰安高新区北店子小学刘清艳.

Unit 7 How much are these pants? Section A 3a-Section B 1b

報告人：丁英智資策會網路多媒體研究所 11/3/2006

Unit 10 Review and check.

学习报告 —语音转换（voice conversion)

极致清新·论文答辩请填写论文副标题或补充内容答辩学生：代用名指导老师：代用名.

A Study on the Next Generation Automatic Speech Recognition -- Phase 2

dì yī kè wǒ ài wǒ jiā 第一课我爱我家 Lesson One I Love My Family

优尼科教育校园宣讲会为了梦想，我们聚到了一起。为了梦想，我们选择飞向远方。南工程站.

The First Course in Speech Lab

闖關卡恭喜你通過所有的考驗！你是超級厲害的棒！三年班號姓名：有色眼鏡占心數九九神功你真棒！神奇敲敲樂魔陣密碼

國立臺北大學 National Taipei University Power Leader 社團精英幹部培訓 2012/12/11.

大学英语跨文化交际 ——中西教育文化差异精神卫生学院林丽菁

四川农业大学第二十二期团校课程第四讲：校团委日常公文与写作主讲人：刘瀛锴.

使用工具优化无线远端关联 --- 《局域网组网技术》安徽建设学校汪双顶.

01 FISHBONE DIAGRAM TARGET PART ONE PART TWO PART THREE PART FOUR

Telephone Numbers詢問電話號碼

前言本文主要以車牌(vehicle license plate)影像之不同大小、複雜環境背景以及不同天候的影像為分析對象，提出一套簡單與便利的車牌自動定位以及辨識技術。

IT行业工作汇报 PPT 模板 Annual Summary of IT Trade 汇报人：PPT研究院.

參考資料：林秋燕曾元顯卜小蝶，Chap. 1、3 Chowdhury，Chap.9

創造不一樣的人生 -如何與身心障礙者接觸新竹教育大學薛明里.

第四章多组资料均数的比较七年制医疗口腔《医学统计学》

Multiple Regression: Estimation and Hypothesis Testing

第三节多重共线性的检验本节基本内容： ● 简单相关系数检验法 ● 方差扩大（膨胀）因子法 ● 直观判断法 ● 逐步回归法.

闽教版小学英语第二册 Unit 4 Time partA 执教者：福清虎邱中心小学翁爱珍.

The formation of the ordinary numbers

STEP THREE NO.1 点击此处添加标题 NO.5 点击此处添加标题 STEP FOUR STEP TWO

阿细蜜源代理系统功能说明官方网站：新版代理系统：

百分数小数、分数.

可换成校徽论文主标题论文副标题指导老师：X教授答辩学生：宝藏PPT.

此处添加标题汇报人：宝藏PPT.

簡單迴歸分析與相關分析莊文忠副教授世新大學行政管理學系計量分析一(莊文忠副教授) 2019/8/3.

北京化工大学（昌平校区）安全稳定工作方案苏建茹 2019/05/09 主讲人日期

96 教育部專案補助計畫案明細單位系所教育部補助款學校配合款工作໨目計畫主持人備註設備費業務費 579,000

Presentation transcript:

基於聯合因子分析與麥克風陣列之強健性語音辨認 Speaker: Wei-Te Fang & Hao-Cheng Chiang National Taipei University of Technology Professor: Yuan-Fu Liao

Overview Joint Factor Analysis (JFA) for Robust Speech Recognition Advanced Microphone Array and ASR Integration Noise - Phase Error Filtering Reverberation - Subband Filtering-and-Sum

Joint Factor Analysis (JFA) for Robust Speech Recognition National Taipei University of Technology Professor: Yuan-Fu Liao

Overview 1.Introduction 2. Joint Factor Analysis (JFA) 雜訊因素傳統解決方法 2. Joint Factor Analysis (JFA) 數學模型 3.JFA for robust speech recognition Case1:環境，語者 Case2:環境，語者，說話內容 Case3:環境，語者，說話內容，語音屬性 4.Summary

Introduction 語音辨認系統干擾因素強健性語音參數求取先驗知識的調適語音模型語者特性雜訊環境通道效應測試環境和訓練環境不匹配強健性語音參數求取 Mean subtraction, Variance normalization, ARMA filtering (MVA) Histogram Equalization (HEQ) 先驗知識的調適語音模型 Reference Model Weighting (RMW) Eigen-Maximum Likelihood Linear Regression (EMLLR) Reference Eigen-Environment and Speaker Weighting (RESW) Probabilistic principal component analysis-Maximun Likelihood Linear Regresstion (PMLLR)

JFA for Speaker Verification 常用的方法: UBM + GMM 古典MAP Eigen-voice Eigen-channel 語者空間通道空間語者相依通道相依

JFA系統流程 Speaker model UBM model

Case1 :考慮環境，語者影響 JFA model表示: 語者空間環境空間語者相依環境相依

JFA系統流程

實驗一實驗設定語料庫:Aurora2 語音內容：加成性雜訊： one, two, three, four, five, six, seven, eight, nine, zero, oh 加成性雜訊：地下鐵雜訊、人聲雜訊、汽車雜訊、展覽會館雜訊、餐廳雜訊、街道雜訊、機場雜訊及火車站雜訊 clean、SNR20 ～ -5 dB

JFA實驗設定語者110人雜訊28種實驗維度設定男生55、女生55 雜訊類型（N1~N4）*SNR（clean~ -5 dB）語者55維、雜訊14維語者55維、雜訊20維語者55維、雜訊24維語者60維、雜訊20維語者70維、雜訊20維

JFA語者特徵空間投影圖語者空間前置分析

JFA之雜訊特徵空間投影圖雜訊空間前置分析

測試環境之綜合比較測試環境效能比較

Case2 :考慮環境，語者，說話內容影響環境空間語者空間說話內容空間 JFA model表示:(假設說話內容特徵空間為g,隱藏變數r(s)) 語者空間環境空間語者相依環境相依說話內容相依說話內容空間

JFA系統流程 Estimate g

加入說話內容之概念說話內容: oh,zero,one,two,three,four,five,six,seven,eight,nine 以oh ,zero ~ nine共11個音當作一個model 假設說話內容特徵空間為g,隱藏變數r(s),則 M (s)= m+ux (s)+vy(s)+gr(s)+dz(s) 加入特徵空間g變數估算方法同v,u,d算法

JFA之語音內容特徵空間投影圖語音內容特徵空間投影圖之分析

實驗二之實驗結果實驗設定固定語者(S) 55維，語音內容(T) 6維，雜訊(N)14維、20維、24維 S 55、T 6、N 14 MVA 錯誤率 4.54 % 4.43 % 4.61 % 4.99%

Case3 :考慮環境，語者，說話內容，語音屬性影響以語音屬性內容為model做attribute detectors JFA model 表示:(假設語音屬性特徵空間為a,隱藏變數q(s)) 語者相依環境相依說話內容相依語音屬性相依語者空間環境空間說話內容空間語音屬性空間

JFA系統流程 Estimate g Estimate a

加入語音屬性之概念以語音屬性為單位當作一個model 加入特徵空間a變數估算方法同v,u,d,g算法

Automatic Speech Attribute Transcription (ASAT) N-Best Rescoring

Summary 實驗結果顯示，JFA方法優於其他系統。可知正確考慮雜訊空間，即越接近實際雜訊情形，即可得到更正確之辨認結果。未來JFA加入語音屬性之後，就可以實現robust speech attribute-based speech recognition。