語音辨識前處理介紹 Jain-De,Lee.

Slides:

Advertisements

Similar presentations

熱烈歡迎各級長官貴賓全體會員蒞臨會場.

Advertisements

教育部輔導教官：林家豪年度育達商職紫錐花運動強化反毒健康小學堂輔導課程簡報.

104 學年度上學期歡迎光臨家長日. 家長日流程 ▲學校宣導事項 ▲選舉班級代表 ▲班級教學與經營說明 ▲親師交流大手牽小手.

温州三中心理健康教育上岗 C 证面试前交流马琳 2010 年 12 月 1 日. —— 自我个性分析.

九年级物理一轮复习第一章声现象知识要点. 1. 声音的产生和传播  （ 1 ）声音的产生：声音是由于物体的振动产生的。  凡是发声的物体都在振动。振动停止，发声也停止。  （ 2 ）声源：正在发声的物体叫声源。固体、液体、气体都可以作为声源，有声音一定有声源。  （ 3 ）声音的传播：声音的传播必须有介质，声音可以在.

信息的传递九年级物理电磁波的海洋. 感悟固定电话之间有电话线连接着，信息是由电流通过电话线传递的移动电话之间没有电话线连接，它是靠什么传递信息的？

声学易混淆的知识点较多，应注意对比辨析。在复习中应注重本章知识在实际生产、生活中的应用。复习时我们尤其要重视本章中的实验，知道实验探究的目的、探究的方法和探究的结论。学法指导.

第一章声现象第二节声音的特征.

生命教育「讓愛傳出去」組別：第10組組員：495i0004 陳靜宜 495i0009 郭品秀 495i0011 林千玉

扬声器的布置与安装.

第五章话语的语用意义(上) 主讲人：周明强.

藝術與人文---太鼓.

34 府学胡同的文天祥祠，相传是南宋民族英雄文天祥当年遭囚禁和就义的地方，1376年明洪武九年建祠。

第一部分中考基础复习第一章声现象.

国王赏麦的故事.

主办:泰兴市质量强市领导小组办公室承办：泰兴市市场监督管理局.

健康檢查簡介新湖國小健康中心王淑華護理師 99/11/17.

高考文言文的整体阅读.

第一章复习锦囊妙计多看书多看笔记善于梳理.

吳慎宜文化大學勞動暨人力資源系講師 FM91.3 台北勞工教育電台台長

综合分析—现象类主讲：王璇时间：

第四章頻率域上的濾波 4.1 背景 4.2 初步的概念 4.3 取樣與經取樣函數的傅立葉轉換 4.4 一個變數的離散傅立葉轉換

第一章气压传动概述一、气压传动基本知识机电一体化技术 1）传动--动力的传递

本课件是由精确校对的word书稿制作的“逐字编辑”课件，如需要修改课件，请双击对应内容，进入可编辑状态。

《生活与哲学》第一轮复习第七课唯物辩证法的联系观.

第三节超声与次声上派中学李泽贵.

等差数列的应用虎山中学高一文科备课组黄小辉.

身边的噪音 ——六（1）班班队活动李瑷蔚符蓉.

Signal and Systems 教師：潘欣泰.

Chapter 12 串級放大 Chih-Hu Wang.

聲紋辨識 100%自製指導老師:趙春棠學生:陳保均學號:

日本班級：六年四班座號：　八號姓名：楊維綱.

青蛙物種聲紋辨識系統參賽學生:李建德、陳家正指導教授:陳文平教授農委會林業試驗所六龜研究中心高雄應用科技大學電機工程系

梅爾倒頻譜係數 (Mel-frequency cepstral coefficients)

語音處理簡介.

一、運算放大器簡介 Introduction to Operational Amplifiers

Wavelet transform 指導教授：鄭仁亮學生：曹雅婷.

Network Application Laboratory

電子儀器量測 Oscilloscope and function generator

FPGA計算浮點數的方法姓名：蔡秉旂.

Chap3 Linked List 鏈結串列.

等差数列的前n项和.

第 11 章諧振電路 11-1 串聯諧振電路 11-2 並聯諧振電路 11-3 串並聯諧振電路

田口方法應用於語音辨識報告者:李建德.

共源極頻率響應科系:通訊工程學系執導老師:王志湖學號:B 姓名:何信賢.

《信息技术与教育技术》听觉媒体技术.

繩波實驗－改進Ｂ5－　翁勝德.

端點偵測介紹.

稀疏雙反旋積非負矩陣分解法結合遮罩應用於蛙類盲訊號分離之研究

林業試驗所六龜研究中心國立高雄應用科技大學網路應用實驗室

通信系統設計平台.

本講義為使用｢訊號與系統，王小川編寫，全華圖書公司出版」之輔助教材

第一章运动的描述第四节实验:用打点计时器测速度.

力学实验复习杨昌彪月.

資管人的規劃 -學校生活資源 1 1.

340m/s 声速：通常情况下,声音在空气中的传播速度是产生：声源的振动（声源有：固体、液体、气体）声音的发生和传播传播：

AM &FM simulation 通訊四甲 B 蕭惟尹.

（）下列何者正確？ (A) 7＜＜8 (B) 72＜＜82 (C) 7＜＜8 (D) 72＜＜82 C 答錯對.

語音訊號的特徵向量張智星多媒體資訊檢索實驗室清華大學資訊工程系.

端點偵測介紹.

數學遊戲二大象轉彎.

2.4 让声音为人类服务.

有理数的乘方(二).

第二节声音的特性人们有规律的、好听悦耳、使人愉快的声音叫做乐音，无规律的、难听刺耳、让人心烦的声音叫做噪声。

多姿多彩的世界.

青蛙物種辨識系統聲紋行政院農業委員會林業試驗所-六龜研究中心國立高雄應用科技大學指導教授:陳文平教授

特殊教育通報網-輔具線上申請及歸還流程.

聲音是一種波測驗題庫陳記住錄製分享資料來源：教育部國民中學學習資源網．

声音的特性.

Presentation transcript:

語音辨識前處理介紹 Jain-De,Lee

大綱預強調音框化端點偵測窗函數

預強調為了補償語音在空氣傳送中，所衰減的高頻訊號，故將語音訊號 s(n) 通過一個高通濾波器，其公式為: 此濾波器有+6dB/oct 高頻增強的特性，故語音訊號通過此高通濾波器結果為: 其中a為一個0.9 ~ 1.0之間的值

預強調

音框化對於語音的離散時間訊號s(n)，利用一個固定長度的視窗(Window)套上，並對視窗內的訊號做運算(如: 取語音特徵)，此行為稱加視窗，而套上的語音訊號稱音框(Frame) 通常視窗長度為20~30ms之間舉例來說，取樣頻率22050Hz，若取視窗長度512點 512 / 22050 ≈ 23.22ms

音框化為了保有語音訊號改變的延續性，通常會讓前後音框部分重疊，一般會重疊1/3或1/2個音框長度取音框示意圖

端點偵測一段語音檔案中，並不是所有的部分都是有效的訊號，因此必須經由端點偵測來判定有聲區段與無聲區段，其優點能讓系統提升效率及辨識率有效聲段

端點偵測一般端點偵測－絕對值能量法、平方和能量法絕對值能量法：其中E(n)為第n 個分析框的能量估算值，p 為該分析框的中心點位置，N 為分析框寬度

端點偵測平方和能量法：其中E(n)為第n 個分析框的能量估算值，p 為該分析框的中心點位置，N 為分析框寬度

端點偵測基本頻譜熵值：其中，pi(fm)為第i個音框下頻率fm的能量所佔比例，E(fm) 為頻率m的能量大小，M為傅立葉轉換點數其中，Hi為第i個音框下的負熵值， pi(fm)為第i個音框下頻率fm的能量所佔比例

端點偵測平均能量熵值：計算整段平均能量將平均能量加入機率密度其中，u為整段訊號的平均能量點，A(n)為第n個點的振幅值， N為訊號總點數將平均能量加入機率密度其中，β為調整值

端點偵測計算加入平均能量後的負熵值其中，Hi’為第i個音框下重新計算後的負熵值

窗函數 otherwise 為了消除視窗兩邊的訊號的不連續，通常會加上漢明窗(Hamming Window)，其公式為: 良好窗函數的頻率響應主葉(Main lobe)頻帶要窄旁葉(Side-lobe)與主葉差距大 otherwise

窗函數常見窗函數:

窗函數窗函數的頻率響應