語音辨識前處理介紹 Jain-De,Lee.

Slides:



Advertisements
Similar presentations
熱烈歡迎 各級長官 貴賓 全體會員 蒞臨會場.
Advertisements

教育部 輔導教官:林家豪 年度育達商職紫錐花運動 強化反毒健康小學堂輔導課程 簡 報.
104 學年度上學期 歡迎光臨家長日. 家長日流程 ▲學校宣導事項 ▲選舉班級代表 ▲班級教學與經營說明 ▲親師交流 大手牽小手.
温州三中心理健康教育 上岗 C 证面试前交流 马 琳 2010 年 12 月 1 日. —— 自我个性分析.
九年级物理一轮复习 第一章 声现象 知识要点. 1. 声音的产生和传播  ( 1 )声音的产生:声音是由于物体的振动产生的。  凡是发声的物体都在振动。振动停止,发声也停止。  ( 2 )声源:正在发声的物体叫声源。固体、液体、气体 都可以作为声源,有声音一定有声源。  ( 3 )声音的传播:声音的传播必须有介质,声音可以在.
信息的传递 九年级物理 电磁波的海洋. 感 悟 固定电话之间有电话 线连接着,信息是由 电流通过电话线传递 的 移动电话之间没有电 话线连接,它是靠什 么传递信息的?
声学易混淆的知识点较多,应注意对 比辨析。在复习中应注重本章知识在实 际生产、生活中的应用。复习时我们尤 其要重视本章中的实验,知道实验探究 的目的、探究的方法和探究的结论。 学法指导.
第一章 声现象 第二节声音的特征.
生 命 教 育 「讓愛傳出去」 組別:第10組 組員:495i0004 陳靜宜 495i0009 郭品秀 495i0011 林千玉
扬声器的布置与安装.
第五章 话语的语用意义(上) 主讲人:周明强.
藝術與人文---太鼓.
34 府学胡同的文天祥祠,相传是南宋民族英雄文天祥当年遭囚禁和就义的地方,1376年明洪武九年建祠 。
第一部分 中考基础复习 第一章 声现象.
国王赏麦的故事.
朝鲜.
主办:泰兴市质量强市领导小组办公室 承办:泰 兴 市 市 场 监 督 管 理 局.
健康檢查簡介 新湖國小健康中心 王淑華護理師 99/11/17.
高考文言文的整体阅读.
第一章 复 习 锦囊妙计 多看书 多看笔记 善于梳理.
吳 慎 宜 文化大學勞動暨人力資源系講師 FM91.3 台北勞工教育電台台長
综合分析—现象类 主讲: 王璇 时间:
第四章 頻率域上的濾波 4.1 背 景 4.2 初步的概念 4.3 取樣與經取樣函數的傅立葉轉換 4.4 一個變數的離散傅立葉轉換
第一章 气压传动概述 一、气压传动基本知识 机电一体化技术 1)传动--动力的传递
本课件是由精确校对的word书稿制作的“逐字编辑”课件,如需要修改课件,请双击对应内容,进入可编辑状态。
《生活与哲学》第一轮复习 第七课唯物辩证法的联系观.
第三节 超声与次声 上派中学 李泽贵.
等差数列的应用 虎山中学高一文科备课组 黄小辉.
身边的噪音 ——六(1)班班队活动 李瑷蔚 符蓉.
Signal and Systems 教師:潘欣泰.
Chapter 12 串級放大 Chih-Hu Wang.
聲紋辨識 100%自製 指導老師:趙春棠 學生:陳保均 學號:
日本 班級:六年四班 座號: 八號 姓名:楊維綱.
青蛙物種聲紋辨識系統 參賽學生:李建德、陳家正 指導教授:陳文平 教授 農委會林業試驗所六龜研究中心 高雄應用科技大學電機工程系
梅爾倒頻譜係數 (Mel-frequency cepstral coefficients)
語音處理簡介.
一、運算放大器簡介 Introduction to Operational Amplifiers
Wavelet transform 指導教授:鄭仁亮 學生:曹雅婷.
Network Application Laboratory
電子儀器量測 Oscilloscope and function generator
FPGA計算浮點數的方法 姓名:蔡秉旂.
Chap3 Linked List 鏈結串列.
等差数列的前n项和.
第 11 章 諧振電路 11-1 串聯諧振電路 11-2 並聯諧振電路 11-3 串並聯諧振電路
田口方法應用於語音辨識 報告者:李建德.
共源極頻率響應 科系:通訊工程學系 執導老師:王志湖 學號:B 姓名:何信賢.
《信息技术与教育技术》听觉媒体技术.
繩波實驗-改進 B5-  翁勝德.
端點偵測介紹.
稀疏雙反旋積非負矩陣分解法結合遮罩應用於蛙類盲訊號分離之研究
林業試驗所六龜研究中心 國立高雄應用科技大學網路應用實驗室
通信系統設計平台.
本講義為使用「訊號與系統,王小川編寫,全華圖書公司出版」之輔助教材
第一章 运动的描述 第四节 实验:用打点计时器测速度.
力学实验复习 杨昌彪 月.
資管人的規劃 -學校生活資源 1 1.
340m/s 声速:通常情况下,声音在空气中的传播速度是 产生: 声源的振动(声源 有:固体、液体、气体) 声音的发生和传播 传播:
AM &FM simulation 通訊四甲 B 蕭惟尹.
( )下列何者正確? (A) 7< <8 (B) 72< <82 (C) 7< <8 (D) 72< <82 C 答 錯 對.
語音訊號的特徵向量 張智星 多媒體資訊檢索實驗室 清華大學 資訊工程系.
端點偵測介紹.
數學遊戲二 大象轉彎.
2.4 让声音为人类服务.
有理数的乘方(二).
第二节 声音的特性 人们有规律的、好听悦耳、使人愉快的声音叫做乐音,无规律的、难听刺耳、让人心烦的声音叫做噪声。
多姿多彩的世界.
青 蛙 物 種 辨識系統 聲紋 行政院農業委員會林業試驗所-六龜研究中心 國立高雄應用科技大學 指導教授:陳文平 教授
特殊教育通報網-輔具線上申請及歸還流程.
聲音是一種波 測驗題庫 陳記住 錄製分享 資料來源:教育部國民中學學習資源網.
声音的特性.
Presentation transcript:

語音辨識前處理介紹 Jain-De,Lee

大綱 預強調 音框化 端點偵測 窗函數

預強調 為了補償語音在空氣傳送中,所衰減的高頻訊號,故 將語音訊號 s(n) 通過一個高通濾波器,其公式為: 此濾波器有+6dB/oct 高頻增強的特性,故語音訊號 通過此高通濾波器結果為: 其中a為一個0.9 ~ 1.0之間的值

預強調

音框化 對於語音的離散時間訊號s(n),利用一個固定長度的 視窗(Window)套上,並對視窗內的訊號做運算(如: 取語音特徵),此行為稱加視窗,而套上的語音訊號 稱音框(Frame) 通常視窗長度為20~30ms之間 舉例來說,取樣頻率22050Hz,若取視窗長度512點 512 / 22050 ≈ 23.22ms

音框化 為了保有語音訊號改變的延續性,通常會讓前後音框 部分重疊,一般會重疊1/3或1/2個音框長度 取音框示意圖

端點偵測 一段語音檔案中,並不是所有的部分都是有效的訊號, 因此必須經由端點偵測來判定有聲區段與無聲區段, 其優點能讓系統提升效率及辨識率 有效聲段

端點偵測 一般端點偵測-絕對值能量法、平方和能量法 絕對值能量法: 其中E(n)為第n 個分析框的能量估算值,p 為該分析框的中心點位置,N 為分析框寬度

端點偵測 平方和能量法: 其中E(n)為第n 個分析框的能量估算值,p 為該分析框的中心點位置,N 為分析框寬度

端點偵測 基本頻譜熵值: 其中,pi(fm)為第i個音框下頻率fm的能量所佔比例,E(fm) 為頻率m的能量大小,M為傅立葉轉換點數 其中,Hi為第i個音框下的負熵值, pi(fm)為第i個音框下 頻率fm的能量所佔比例

端點偵測 平均能量熵值: 計算整段平均能量 將平均能量加入機率密度 其中,u為整段訊號的平均能量點,A(n)為第n個點的振幅值, N為訊號總點數 將平均能量加入機率密度 其中,β為調整值

端點偵測 計算加入平均能量後的負熵值 其中,Hi’為第i個音框下重新計算後的負熵值

窗函數 otherwise 為了消除視窗兩邊的訊號的不連續,通常會加上漢明 窗(Hamming Window),其公式為: 良好窗函數的頻率響應 主葉(Main lobe)頻帶要窄 旁葉(Side-lobe)與主葉差距大 otherwise

窗函數 常見窗函數:

窗函數 窗函數的頻率響應