語音訊號的特徵向量 張智星 jang@cs.nthu.edu.tw http://www.cs.nthu.edu.tw/~jang 多媒體資訊檢索實驗室 清華大學 資訊工程系.

Slides:



Advertisements
Similar presentations
最大公因數與最小公倍數 吳嵐婷.  因數倍數消消樂  17 年蟬的秘密  最大公因數 ( 剪紙實例 )  利用標準分解式求最大公因數 ( 撲克牌活動 )  最大公因數應用問題  最小公倍數 ( 堆疊實例 )  最小公倍數應用問題 大綱.
Advertisements

第 1 章 信號與系統簡介 by 胡興民老師 連續時間信號與離散時間信號 連續時間信號 (continuous-time signal) :連續時間 信號以函數 x(t) 表示之,其中 t 是連續時間變數 。 離散時間信號 (discrete-time signal) :離散時間信 號只定義在離散的時間點上,一般以離散時間變數.
數位訊號處理概論 [ 音樂情感 Music Emotion ] 資工三甲 4A1G0030 李裕家 1.
传媒学生应该如何度 过四年大学生活?. 进入大学一个多月了,用一个词形容大 学生活 自卑感 不适应 空虚感 被动感 孤独感 失望感 一、大学新生不适应大学生活的表现:
動動腦時間 — 腦筋急轉彎 —. 1. 有三個小朋友在猜 拳,一個出石頭,一 個出布,一個出剪刀, 請問三個人共有幾根 指頭? 答案: 60 根.
MATLAB 程式設計 時間量測 清大資工系 多媒體資訊檢索實驗室.
美国人最爱说的一个单词是“try”。成都有个年轻人在研制一种安装折翼的可飞行汽车,在国内无人理睬,被认为是异想天开,可美国的一个机构却邀请他去美国“try”,并为他提供条件。其实,在中国也有敢于“try”的人。开放特区是“try”,“一国两制”也是“try”,只有具有创新意识的科学构想付诸实践,才能真正推动人类的进步、社会的发展。
企业涉税业务基本知识宣传 郑州航空港区国家税务局机场税务分局 王 磊.
学党章党规、学系列讲话,做合格党员 学习教育
數位訊號處理 第4章 離散時間訊號與LTI系統之傅利葉分析
大 播 海 直.
講師:陳錦芳 樹德科技大學人類性學研究所 性教育推廣中心專聘講師 美國ACS執照性學家
教師晨會經驗分享 小學雙語實驗教育實施現況之研究 計畫主持人:陳金粧校長、馮思義副校長 指導顧問:陳惠邦教授、鄧奮忠主任、呂慧芬組長
教师科研:问题与方法 ——以课堂观察为例 广西师大教科院 耿涓涓 QQ:
「品格教育的理念與實踐」研討會 心得分享:羅旭壯 96年5月14日(一).
基隆市立八斗高中 102 學年度第二學期 402 班『親師座談』
项目申报及投资推进工作实务 更多模板、视频教程: 兰溪市发展和改革局 2013年9月 1.
实践 课题 周围环境对当代大学生成长的影响 指导老师:王永章 小组成员:陈荣、刘若楠、张红艳、吕雪丹、樊金芳、李惠芬、黄婧
騎乘單車如何配速 桃園縣攝影藝術協會 鐵馬車隊 鄭育宏 製作 1/12.
Audio.
運動對三高的重要性 運動處方的設計 陳世銘 物理治療師.
XI. Hilbert Huang Transform (HHT)
Time and frequency domain
Signal and Systems 教師:潘欣泰.
Applications of Digital Signal Processing
V. Homomorphic Signal Processing
報告人:丁英智 資策會 網路多媒體研究所 11/3/2006
導師會議
張智星 (Roger Jang) 台大資訊系 多媒體檢索實驗室 CSIE/NTU, MIR Lab
青蛙物種聲紋辨識系統 參賽學生:李建德、陳家正 指導教授:陳文平 教授 農委會林業試驗所六龜研究中心 高雄應用科技大學電機工程系
梅爾倒頻譜係數 (Mel-frequency cepstral coefficients)
梅爾倒頻譜係數 (Mel-frequency cepstral coefficients)
GoldWave 音樂編輯軟體 -演算法與技巧- 學生: 冼達 指導教授: 丁建均 DISP, NTU 2018/11/20.
Outline 暫存目錄 暫存檔案 網路檔案讀取 寄發電子郵件 音訊的基本介紹 WAV檔案讀取.
第3章 RF的基本觀念 2018/11/24.
32位元處理器之定點數MFCC演算法的改進與探討 Improvement and Discussion of MFCC Algorithm on 32-bit Fixed-point Processors 學生:陳奕宏 指導教授:張智星.
哼唱檢索之商品化 張智星 多媒體資訊檢索實驗室 清華大學 資訊工程系.
1 Introduction Prof. Lin-Shan Lee.
Gold Wave Sound editing software B 晏彩霞.
VI. Brief Introduction for Acoustics
Network Application Laboratory
TTS (文字轉語音) Roger Jang (張智星)
語音辨識 張智星 多媒體資訊檢索實驗室 清華大學 資訊工程系.
金融行銷溝通技巧- 溝通的藝術 南山人壽洪全銘經理
1 Introduction Prof. Lin-Shan Lee.
建国以来,大陆对台政策 金亚丽 周莎 黄运娜.
荧光光谱分析仪 分析测试中心 陈仕云.
行政管理者 的素质要求 中南大学湘雅医院 李远斌
張智星 清大資工系 多媒體檢索實驗室 Tree Net Construction 張智星 清大資工系.
田口方法應用於語音辨識 報告者:李建德.
Graph Theory Chapter 2 An Introduction to Algorithms
第4章 连续时间傅立叶变换 The Continuous-Time Fourier Transform
側掃聲納資料處理系統之研究 音訊之收錄及資料後處理系統 Sidescan Sonar Data Processing System
求職防騙面面觀 不累生活文化有限公司 行政總監 賴永洲.
波與粒子 波的類型 機械波 電磁波 物質波:matter
端點偵測介紹.
國立台灣師範大學資訊工程研究所 語音實驗室研究簡介
張智星 多媒體資訊檢索實驗室 台灣大學 資訊工程系
端點偵測介紹.
本講義為使用「訊號與系統,王小川編寫,全華圖書公司出版」之輔助教材
日期:2009年10月22日 報告單位: 京年升電腦科技有限公司 報 告 人:副總經理 楊世豐 Power
國立苑裡高中 基礎物理講義 聲音(週期波)三要素 噪音
語音辨識前處理介紹 Jain-De,Lee.
第三章 音樂檢索技術 1) 內涵式音樂資訊檢索(content-based music information retrieval)
張仁俊 (Jen-Chun Chang) 國立台北大學 資訊工程學系 通訊工程研究所 電機工程研究所
鳥聲辨識之初步研究與分析 Initial Studies and Analysis of Birdsong Recognition
Gyrophone: Recognizing Speech From Gyroscope Signals
第12章 语音合成.
語音特徵擷取之 資料相關線性特徵轉換 研究生:張志豪 多酌墨在數學式的物理意義及精神。 老師、各位口試委員、各位同學大家好。
Presentation transcript:

語音訊號的特徵向量 張智星 jang@cs.nthu.edu.tw http://www.cs.nthu.edu.tw/~jang 多媒體資訊檢索實驗室 清華大學 資訊工程系

語音訊號的辨識流程 基本流程 擷取語音訊號 消除雜訊 音框化 音框轉成特徵向量 以特徵向量進行辨識

語音訊號的特徵向量 旋律辨識 音高(Pitch) 一般音訊分類 音高 過零率 音量 明亮度

語音訊號的特徵向量 語者辨識 MFCC(Mel-frequency cepstral coefficients,包含一階導數,對數能量值) Normalized MFCC (採取 Cepstrum Mean Subtraction 法) Real cepstrum LPC (Linear Predictive Coding)係數 Real cepstrum參數 LSP (Line Spectrum Pair)參數 PARCOR參數

語音訊號的特徵向量 語音辨識 MFCC(Mel-frequency cepstral coefficients,包含一階導數,對數能量值) Normalized MFCC (採取 Cepstrum Mean Subtraction 法)

人聲的發聲機制及其數學模型 Source-filter model: Speech is split into a rapidly varying excitation signal and a slowly varying filter. The envelope of the power spectra contains the vocal tract info. Two important characteristics of the model are fundamental (pitch) frequency (f0) and formants (F1, F2, F3, …)

聲音的基本特質 音量:音波的震幅大小 音高:音波的基本頻率高低 內容或音色:每一個波形在一個週期的變化

Pitch and Formants Pitch and formants can be defined visually: Pitch period = 1/f0 First formant F1 Second formant F2

Real-time Spectrogram Try “dspstfft_nt”: Spectrum: Spectrogram:

Physical Meanings of Cepstrum