張智星 (Roger Jang) 清大資工系 多媒體檢索實驗室

Slides:



Advertisements
Similar presentations
第一單元 建立java 程式.
Advertisements

張智星 清大資工系 多媒體檢索實驗室 MATLAB 程式設計進階篇 程式計時 張智星 清大資工系.
MATLAB 程式設計 時間量測 清大資工系 多媒體資訊檢索實驗室.
計算機程式語言實習課.
1012 MATLAB 教學 彭奕翔 2013/02/27.
TQC+ JAVA全國教師研習會 PLWeb 程式設計練習平台 簡介.
Hadoop 單機設定與啟動 step 1. 設定登入免密碼 step 2. 安裝java step 3. 下載安裝Hadoop
聲音檔和 Video 檔的讀與寫 (by Matlab)
主題五 CPU Learning Lab.
題目:十六對一多工器 姓名:李國豪 學號:B
Chapter 5 迴圈.
正反器 一、循序邏輯電路 二、動作情形:用時序(timing),其次輸出( )是由外界輸入與( )所共同決定。
張智星 (Roger Jang) 台大資訊系 多媒體檢索實驗室 CSIE/NTU, MIR Lab
Q101 在701 SDX Linux上的標準安裝與使用程序v2
2-3 基本數位邏輯處理※.
Outline 暫存目錄 暫存檔案 網路檔案讀取 寄發電子郵件 音訊的基本介紹 WAV檔案讀取.
JAVA 程式設計與資料結構 第六章 輸出與輸入.
MATLAB 程式設計入門篇 與Excel試算表的整合
電腦硬體裝修乙級 第二站-伺服器端系統安裝與環境設定
類別(class) 類別class與物件object.
SQL Stored Procedure SQL 預存程序.
R教學 安裝RStudio 羅琪老師.
安裝JDK 安裝Eclipse Eclipse 中文化
雲端運算的基石(2) 虛擬化技術實作(XP篇─上)
檔案與磁碟的基本介紹.
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
系統設定 IE8相容性檢視
Wavelet transform 指導教授:鄭仁亮 學生:曹雅婷.
Java 程式設計 講師:FrankLin.
私立南山高中 信息組 電腦研習 電腦資料的備份 中華民國 99年4月20日 星期二.
Chap3 Linked List 鏈結串列.
4.1 不同的音頻屬性 4.2 常見的音頻檔案格式 4.3 在音頻檔案容量與質素之間取得平衡 4.4 按需要改變音頻檔案的屬性.
第一單元 建立java 程式.
PLC-GPPW軟體使用教學 授課教師:張祖烈
音訊讀寫、錄製與播放 方煒 台大生機系.
第三章 資料型態與輸出控制 本章學習目標 認識Matlab的基本資料型態 練習資料型態的轉換 學習如何控制Matlab的輸出格式
PowerPoint 2019/4/9.
輸入&輸出 函數 P20~P21.
混音實作 高雄市新民國小 林佳宏
張智星 清大資工系 多媒體檢索實驗室 Tree Net Construction 張智星 清大資工系.
音效卡的功能及運作原理.
CH05. 選擇敘述.
撰寫MATLAB基礎財務程式 柯婷瑱.
HelloPurr_Extend 靜宜大學資管系 楊子青
MicroSim pspice.
講師:高宏宣 “景文科技大學應用英語系” 『電腦輔助教學』課程講義 Gold WAVE音訊軟體 講師:高宏宣
Video 影像 (VideoPlayer 影像播放器、Camcorder 錄影機) 靜宜大學資管系 楊子青
挑戰C++程式語言 ──第7章 輸入與輸出.
流程控制:Switch-Case 94學年度第一學期‧資訊教育 東海大學物理系.
Text To Speech (TTS, 文字轉 語音)、讀簡訊 靜宜大學資管系 楊子青
MiRanda Java Interface v1.0的使用方法
陣列與結構.
程式移植.
Chapter 15 檔案存取 LabVIEW中的檔案存取函數也可將程式中的資料儲存成Excel或Word檔。只要將欲存取的檔案路徑位址透過LabVIEW中的路徑元件告訴檔案存取函數後,LabVIEW便可將資料存成Excel或Word檔;當然也可以將Excel或Word檔的資料讀入LabVIEW的程式中。
使用VHDL設計-8x3編碼電路 通訊一甲 B 楊穎穆.
6.1 動畫檔案的格式 6.2 建立合適的動畫元素.
資料表示方法 資料儲存單位.
語音訊號的特徵向量 張智星 多媒體資訊檢索實驗室 清華大學 資訊工程系.
Cloud Training Material- 事件 Sherman Wang
小畫家教學 電子版儲存於 學校網頁/學科資訊/電腦科
多國語系 建國科技大學 資管系 饒瑞佶.
ABAP Basic Concept (2) 運算子 控制式與迴圈 Subroutines Event Block
NFC (近場通訊, Near Field Communication) 靜宜大學資管系 楊子青
Array(陣列) Anny
SQLite資料庫 靜宜大學資管系 楊子青.
10303: How Many Trees? ★★☆☆☆ 題組:Contest Archive with Online Judge
Chapter 4 Multi-Threads (多執行緒).
Unix指令4-文字編輯與程式撰寫.
ABAP Basic Concept (2) 運算子 控制式與迴圈 Subroutines Event Block
InputStreamReader Console Scanner
Presentation transcript:

張智星 (Roger Jang) jang@mirlab.org http://mirlab.org/jang 清大資工系 多媒體檢索實驗室 音訊讀寫、錄製與播放 張智星 (Roger Jang) jang@mirlab.org http://mirlab.org/jang 清大資工系 多媒體檢索實驗室

20-1 音訊的基本介紹 聲音訊號(Audio Signal)簡稱音訊,泛指由人耳聽到的各種聲音的訊號。音訊有些基本的特質,可說明如下: 20-1 音訊的基本介紹 聲音訊號(Audio Signal)簡稱音訊,泛指由人耳聽到的各種聲音的訊號。音訊有些基本的特質,可說明如下: 音量(Volume):聲音的大小稱為音量,又稱為力度、強度(Intensity)或是能量(Energy)。音量越大,代表音訊波形的震幅越大。 音高(Pitch):聲音的基本頻率(Fundamental Frequency)越高,代表音高越高(例如女高音的歌聲);反之,聲音的基本頻率越低,代表音高越低(例如男低音的歌聲)。(有關基本頻率的說明,將在本章其後各小節說明。) 音色(Timber):音訊波形在每個週期內的變化,就形成了此音訊的音色。不同的音色即代表不同的音訊內容,例如不同的字有不同的發音,或是不同的歌手有不同的特色,這些都是由於音色不同而產生。

20-2 WAV檔案的讀取範例之一 例如,若要讀取光碟中的檔案 welcome.wav,畫出音訊的波形並播放出此音訊,可使用下列程式: 範例20-1: readWave01.m [y, fs]=wavread('welcome.wav'); sound(y, fs); % 播放此音訊 time=(1:length(y))/fs; % 時間軸的向量 plot(time, y); % 畫出時間軸上的波形

20-2 WAV檔案的讀取範例之一 執行結果:歡迎光臨波形圖

20-2 WAV檔案的讀取範例之二 若要知道 welcome.wav 的取樣點是由多少個位元來表示,可使用 [y, fs, nbits] = wavread(‘welcome.wav’)。若要知道音訊長度,則可使用 length(y)/fs。以下範例可以印出音訊檔 welcome.wav 的各種相關資訊: 範例20-2: readWave02.m fileName='welcome.wav'; [y, fs, nbits]=wavread(fileName); fprintf('音訊檔案 "%s" 的資訊:\n', fileName); fprintf('音訊長度 = %g 秒\n', length(y)/fs); fprintf('取樣頻率 = %g 取樣點/秒\n', fs); fprintf('解析度 = %g 位元/取樣點\n', nbits);

20-2 WAV檔案的讀取範例之二 範例20-2執行結果: 音訊檔案 "welcome.wav" 的資訊: 音訊長度 = 1.45134 秒 取樣頻率 = 11025 取樣點/秒 解析度 = 8 位元/取樣點

20-2 WAV檔案的讀取範例之三 wav 檔案的 8 位元是以 unsigned integer的方式來儲存,因此所能表示的數值是介於 0 和 255 之間,MATLAB 再將此值設定至變數 y 時,會自動將其數值調整至介於 –1 和 1 之間,因此若要將 MATLAB 讀出之數值轉回原先 8 位元所表示之數值,只要將變數 y 乘以 128,再加上 128,就可以得到原先的整數值,例如: 範例20-3: readWave03.m difference = 0 fileName='welcome.wav'; [y, fs, nbits]=wavread(fileName); y0=y*(2^nbits/2)+(2^nbits/2); % y0 是原先儲存在音訊檔案中的值 difference=sum(abs(y0-round(y0)))

20-2 WAV檔案的讀取範例之四 wavread 也可以讀取雙聲道或立體聲(Stereo)的音訊檔案,此時傳回的變數為具有兩直行的陣列,每一直行代表一個聲道的音訊,例如: 範例20-4: readWave04.m fileName='flanger.wav'; [y, fs]=wavread(fileName); % 讀取音訊檔 sound(y, fs); % 播放音訊 left=y(:,1); % 左聲道音訊 right=y(:,2); % 右聲道音訊 subplot(2,1,1), plot((1:length(left))/fs, left); subplot(2,1,2), plot((1:length(right))/fs, right);

20-2 WAV檔案的讀取範例之四 此範例會讀取雙聲道的音訊檔 flanger.wav,播放此雙聲道的音訊,並畫出兩個聲道的音訊波形如下:

20-2 WAV檔案的讀取範例之五 如果音訊檔案很大,無法一次讀入記憶體,我們也可以使用 wavread 來讀出音訊檔的其中一部份,例如: 範例20-5: readWave05.m [y,fs]=wavread('welcome.wav', [4001 5000]); % 讀取第4001至5000點 figure; plot(y)

20-2 WAV檔案的讀取範例之五 畫出之圖形如下:

20-2 WAV檔案的讀取範例之六 若要取得 wav 檔案的更多資訊,可由 wavread 的第四個輸出變數得到,例如: 範例20-6: readWave06.m ans = wFormatTag: 1 nChannels: 2 nSamplesPerSec: 22050 nAvgBytesPerSec: 88200 nBlockAlign: 4 nBitsPerSample: 16 [y, fs, nbits, opts]=wavread('flanger.wav'); opts.fmt

20-3 聲音訊號的播放 一旦我們可以讀入 wav 檔案,就可以對聲音訊號進行各種處理,例如增大或減小音量、提高或降低音高、消除雜訊等。要確認處理後的聲音訊號是否符合所需,就要能夠把音訊直接透過 PC 喇叭播放出來,本節就是要介紹如何使用 MATLAB 來進行音訊的播放。

20-3 WAV檔案的播放範例之一 在前一節中,我們已經知道如何讀 wav 檔案,一旦 MATLAB 讀入音訊資料,並將之設定成工作空間中的變數後,我們就可以使用 wavplay 指令來直接播放此變數。例如: 範例20-7: wavPlay01.m load handel.mat % 載入儲存於 handel.mat 的音訊 wavplay(y, Fs); % 播放此音訊

20-3 WAV檔案的播放範例之二 我們在第一節提到過,聲音的音量是由聲波的震幅來決定,因此我們可藉由震幅的大小來改變音量,例如: 範例20-8: playVolume01.m [y, fs]=wavread('welcome.wav'); wavplay(1*y, fs, 'sync'); % 播放1倍震幅的音訊 wavplay(3*y, fs, 'sync'); % 播放2倍震幅的音訊 wavplay(5*y, fs, 'sync'); % 播放3倍震幅的音訊

20-3 WAV檔案的播放範例之三 如果在播放時,改變取樣頻率,就會改變整個音訊的時間長度,進而影響到音高。在下例中,我們漸漸提高播放時的取樣頻率,聽到的聲音就會越來越快、越來越高,最後出現像唐老鴨的聲音: 範例20-9: playFs01.m [y, fs]=wavread('welcome.wav'); wavplay(y, 1.0*fs, 'sync'); % 播放 1.0 倍速度的音訊 wavplay(y, 1.2*fs, 'sync'); % 播放 1.2 倍速度的音訊 wavplay(y, 1.5*fs, 'sync'); % 播放 1.5 倍速度的音訊 wavplay(y, 2.0*fs, 'sync'); % 播放 2.0 倍速度的音訊

20-3 WAV檔案的播放範例之四 反之,如果漸漸降低播放的頻率,聽到的聲音就會越來越慢、越來越低,最後出現像牛叫的聲音: 範例20-10: playFs02.m [y, fs]=wavread('welcome.wav'); wavplay(y, 1.0*fs, 'sync'); % 播放 1.0 倍速度的音訊 wavplay(y, 0.9*fs, 'sync'); % 播放 0.9 倍速度的音訊 wavplay(y, 0.8*fs, 'sync'); % 播放 0.8 倍速度的音訊 wavplay(y, 0.6*fs, 'sync'); % 播放 0.6 倍速度的音訊

20-3 WAV檔案的播放範例之五 如果我們將聲波訊號上下顛倒,聽到的聲音基本上是一樣的,但是如果前後顛倒,聽到的聲音就如同錄音帶「倒放」的聲音,聽起來很像是某種外國語音,請試試下列範例: 範例20-11: playReverse01.m [y, fs]=wavread('welcome.wav'); wavplay(y, fs, 'sync'); % 播放正常的音訊波形 wavplay(-y, fs, 'sync'); % 播放上下顛倒的音訊波形 wavplay(flipud(y), fs, 'sync'); % 播放前後顛倒的音訊波形

20-3 WAV檔案的播放範例之六 通常在使用 wavplay 播放音訊時,MATLAB 會停止進行其他動作,直到音訊播放完畢後,才會再進行其他指令的運算,此種運作方式稱為「同步式」(Synchronous)。若需要一邊播放、一邊進行其他運算,就必須使用「非同步式」(Asynchronous)的播放方式。 提醒:wavplay指令只適用於32-bit Windows平台。若在64-bit Windows平台,請改用audioplayer指令。 範例20-12: playSync01.m [y, fs]=wavread('welcome.wav'); wavplay(y, 1.0*fs, 'sync'); % 同步播放 1.0 倍速度的音訊 wavplay(y, 0.8*fs, 'async'); % 非同步播放 0.8 倍速度的音訊 wavplay(y, 0.6*fs, 'async'); % 非同步播放 0.6 倍速度的音訊

20-3 WAV檔案的播放範例之七 wavplay 只能用在微軟的視窗平台,而且若在 MATLAB 5.x, 你還必須要有訊號處理工具箱,才能使用這個指令。若要使用適用於一般平台的播放功能,就要改用 sound 指令。 在此例中,我們會聽到類似男女兩部合唱,一快一慢,這是因為 sound 指令的預設播放方式就是「非同步」。 提醒:wavplay指令只適用於32-bit Windows平台。若在64-bit Windows平台,請改用audioplayer指令。 範例20-13: playSync02.m load handel.mat sound(y, Fs); sound(y, 1.2*Fs);

20-3 WAV檔案的播放範例之八 另一個類似的指令是 soundsc,此指令可針對音訊變數的數值先進行正規化(介於 –1 和 1 中間)後,再送到喇叭播放,以達到最好的播放效果。例如: 範例20-14: soundsc01.m [y, fs]=wavread('welcome.wav'); sound(y, fs); fprintf('Press any key to continue...\n'); pause soundsc(y, fs);

20-4 聲音訊號的錄製 我們在第一節已經說明了如何讀取 wav 檔案,並在第二節說明如何播放。MATLAB 也支援直接由麥克風讀取訊號,因此可以直接進行聲音的錄製,所使用的指令是 wavrecord,其基本格式為: y=wavrecord(n, fs)

20-4 WAV檔案的錄製範例之一 y=wavrecord(n, fs)代表由微軟視窗系統的音訊輸入裝置(即麥克風)讀入 n 點資料,取樣頻率是 fs,並將此音訊資料儲存於變數 y。舉例來說: 範例20-15: wavRecord01.m fs=11025; % 取樣頻率 duration=2; % 錄音時間 fprintf('按任意鍵後開始 %g 秒錄音:', duration); pause fprintf('錄音中...'); y=wavrecord(duration*fs, fs); % duration*fs 是錄音資料點數 fprintf('錄音結束\n'); fprintf('按任意鍵後開始播放:'); pause wavplay(y,fs);

20-4 WAV檔案的錄製範例之二 在前一個範例中,wavrecord 預設的錄音聲道數為 1(即單聲道),音訊資料型態為 double,若要改變這兩種預設值,可在 wavrecord 加入其他引數,其完整的格式為y=wavrecord(n, fs, channel, dataType)其中channel(通常是 1 或 2)代表聲道數,dataType 則代表音訊變數 y 的資料型態可以是下列幾種:double、single、int16、uint8。不同的資料型態,影響音訊資料的精準度,所佔掉的儲存空間大小也不同。例如: 範例20-16: wavRecord02.m fs=11025; % 取樣頻率 duration=2; % 錄音時間 channel=1; % 單聲道 fprintf('按任意鍵後開始 %g 秒錄音:', duration); pause fprintf('錄音中...'); y=wavrecord(duration*fs, fs, channel, 'uint8'); % duration*fs 是錄音資料點數 fprintf('錄音結束\n'); fprintf('按任意鍵後開始播放:'); pause wavplay(y,fs);

20-5 聲音訊號的寫檔 我們也可以經由 MATLAB 將音訊資料直接儲存為 wav 檔案,以便日後直接在微軟視窗下播放,而不需每次都經由 MATLAB 播放。寫入 wav 檔案的指令是 wavwrite,其格式為: wavwrite(y, fs, nbits, waveFile)

20-5 WAV檔案的寫檔範例 wavwrite(y, fs, nbits, waveFile)其中 y 是音訊變數,fs 是取樣頻率,nbits 是資料解析度,waveFile 則是欲寫入資料的檔案名稱。例如,若要將我們的錄音存入 test.wav,可用下列程式碼: 範例20-17: wavWrite01.m fs=11025; % 取樣頻率 duration=2; % 錄音時間 waveFile='test.wav'; % 欲儲存的 wav 檔案 fprintf('按任意鍵後開始 %g 秒錄音:', duration); pause fprintf('錄音中...'); y=wavrecord(duration*fs, fs); fprintf('錄音結束\n'); fprintf('按任意鍵後開始儲存音訊至 %s 檔案...', waveFile); pause nbits=8; % 每點的解析度為 8-bit wavwrite(y, fs, nbits, waveFile); fprintf('存檔結束\n'); fprintf('按任意鍵後開始播放 %s...\n', waveFile); dos(['start ', waveFile]); % 開啟與 wav 檔案對應的應用程式