計算幾何學期末報告 題目:多模式音樂檢索 指導老師: 陳俊銘 學生: I4B 22 劉恩賜.

Slides:



Advertisements
Similar presentations
第一章 声现象 第二节声音的特征.
Advertisements

單元九:單因子變異數分析.
LinkIt ONE開發板的簡介.
MATLAB 程式設計 時間量測 清大資工系 多媒體資訊檢索實驗室.
LED CUBE 預期規劃.
朝鲜.
健康檢查簡介 新湖國小健康中心 王淑華護理師 99/11/17.
TQC+ JAVA全國教師研習會 PLWeb 程式設計練習平台 簡介.
身边的噪音 ——六(1)班班队活动 李瑷蔚 符蓉.
Strain Variation for B-Mode Image
Speaker :Fanjia Yen Adviser : Quincy Wu Date : 2007/11/15
房欣漢、陳志達 南台科技大學資訊管理所 整合網路社群與3D地圖資訊之多元混搭服務 Intermediating the Internet Mashup Service for the Network Community & 3D Geography.
主題五 CPU Learning Lab.
題目:十六對一多工器 姓名:李國豪 學號:B
日本 班級:六年四班 座號: 八號 姓名:楊維綱.
第一篇 Unix/Linux 操作介面 第 1 章 Unix/Linux 系統概論 第 2 章 開始使用 Unix/Linux
使用VHDL設計—4位元加法器 通訊一甲 B 楊穎穆.
使用VHDL設計—4位元位移器 通訊一甲 B 楊穎穆.
What’s New in HTML5.
(Circular Linked Lists)
Wavelet transform 指導教授:鄭仁亮 學生:曹雅婷.
視覺式體操動作辨識系統 Vision-based Gymnastics Motion Recognition System 學生:顏羽君
管理資訊系統導論 資訊系統的定義與概念.
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
使用者經驗設計 User Experience Design
大數據與我 4A 陳駿榜.
網路安全技術 OSI七層 學生:A 郭瀝婷 指導教授:梁明章.
4.1 不同的音頻屬性 4.2 常見的音頻檔案格式 4.3 在音頻檔案容量與質素之間取得平衡 4.4 按需要改變音頻檔案的屬性.
Topic Introduction—RMI
TB-054A  周天穎 編著 儒林圖書公司 發行.
Ch20. 計算器 (Mac 版本).
淑明女子大學 在哪裡?. 淑明女子大學 在哪裡? 學校週遭 第一次 剛到淑大時?
第 19 章 XML記憶體執行模式.
雲端計算.
Google Play2016年 臺灣年度最佳精選榜
使用VHDL設計 七段顯示器 通訊工程系 一年甲班 姓名 : 蘇建宇 學號 : B
期末考.
挑戰C++程式語言 ──第8章 進一步談字元與字串
蕭志明 老師 Algorithm(演算法) Ext:6779
蕭志明 老師 Algorithm(演算法) /FB:
Ogive plot example 說明者:吳東陽 2003/10/10.
《信息技术与教育技术》听觉媒体技术.
以四元樹為基礎抽取圖片物件特徵 之 影像檢索
(Mobile User music–Sharing Innovation Center)
講師:高宏宣 “景文科技大學應用英語系” 『電腦輔助教學』課程講義 Gold WAVE音訊軟體 講師:高宏宣
電腦概論考題分析 佛學資訊組 碩一 張榮顯.
國立台灣師範大學資訊工程研究所 語音實驗室研究簡介
黃影雯副教授講授 E_Mail Address:
課程時間:星期二下午2:20-5:20 -> 1:20-4:10 ? 授課教師 逄愛君, 辦公室: 資訊系館 417室 先修課程
11058: Encoding ★☆☆☆☆ 題組:Problem Set Archive with Online Judge
Commando War ★★☆☆☆ 題組:Problem Set Archive with Online Judge
力学实验复习 杨昌彪 月.
Chapter 9 慣性矩 9-1 面積慣性矩 9-2 平行軸原理 9-3 組合面積之慣性矩 9-4 迴轉半徑 9-5 質量慣性矩
使用VHDL設計-8x3編碼電路 通訊一甲 B 楊穎穆.
國立台灣大學 關懷弱勢族群電腦課程 By 資訊工程 黃振修
語音訊號的特徵向量 張智星 多媒體資訊檢索實驗室 清華大學 資訊工程系.
資料擷取與監控應用實務.
邏 輯 設 計__編碼器 學生:宋敬萱 指導老師:王志湖.
校外實習媒合資訊平台介紹 報告人:王上明 指導單位: 教育部技職司 承辦單位: 明志科技大學 、 國立高雄第一科技大學.
資料結構與C++程式設計進階 期末考 講師:林業峻 CSIE, NTU 7/ 15, 2010.
第十三章 彩色影像處理.
All Sources Shortest Path The Floyd-Warshall Algorithm
第四組 停車場搜尋系統 第四組 溫允中 陳欣暉 蕭積遠 李雅俐.
第一章 電子商務簡介 第一篇 電子商務概論篇.
使用VHDL設計-七段顯示 通訊一甲 B 楊穎穆.
Chapter 4 Multi-Threads (多執行緒).
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
指導老師:張慶寶 組員 : 蔡維庭 4970E028 劉明哲 4970E079 葉聖鴻 4991E020 康有成 4970E004
声音的特性.
‘人因罪與神隔絕’ 左邊代表每一個人像你和我。 黑暗代表我們的罪。 聖經說: 世人都犯了罪,虧缺了神的榮耀。 (羅3:23)
Presentation transcript:

計算幾何學期末報告 題目:多模式音樂檢索 指導老師: 陳俊銘 學生: I4B 22 劉恩賜

Introduction 數位典藏服務是一門很新的領域,而將各 種文化典藏數位化紀錄下來以利傳播及保 存已經成為一種趨勢,並且能以簡單而自 然的方式進行檢索更是一個重要議題,多模 式音樂檢索』為例,提供過去我們在建立 音樂資料庫、資訊數位化的處理以及資訊 檢索流程

多模式的音樂檢索方式 多模式的音樂檢索方式的設計、開發以及 應用數位典藏檢索,並且能與不同的典藏 資料檢索整合,藉此發揮數位典藏在使用 者服務功能上的價值以及提高數位典藏檢 索的功能。 目前在國內和國外的研究並不多見,目前 較具規模的大至分點說明如下:

英國Southampton大學QBH系統 這篇論文算是早期最具代表性的一篇報告。QBH (Query By Humming)的系統 他們透過自相關演算(Auto-correlation)來求得 輸入聲波的基頻分佈圖(Pitch Contour),並將 其轉成包含了U、D、R的字串用以進行音樂資料 庫的搜尋。 他們並未發展出一套完整的音符切割程序,使用 者必須自行分割音符,並未達到真正的自動化。 僅僅只能算是在直覺式歌唱輸入音樂搜尋上邁出 了第一步。

QBH編碼 S S U S D U D

紐西蘭Waikato大學 缺點: 無法正確地將音符切割開 採用以歌選歌的方法 他們和紐西蘭數位音樂資料庫合作開發出了一套名為MT (Melody Transcription)的系統,藉著金-瑞賓勒演算法 (Gold-Rabiner Algorithm)找出輸入聲波的基頻分佈, 並接著轉成標準音符表示 缺點: 無法正確地將音符切割開

設計原理分析 整個系統大致可以分為四大部分:音樂資料庫建構、輸入聲音數位訊號處理程序、搜尋比對程序、平行處理。整體架構如右圖所示。

輸入聲音數位訊號處理程序 主要用於將使用者哼、唱以及敲擊的輸入聲音經由一連串的訊號處理程序換變成和音樂資料庫相同的中界格式以方便比對, 概略可以分為:聲音取樣過濾、基頻粹取(Pitch Tracking)、轉換成中介格式

聲音取樣過濾 我們以11025HZ為我們的取樣頻率,輸入的聲音以8位元進行量化,並將能量過低的聲音訊號視為雜訊過濾

基頻粹取 輸入的聲波視為一帶有固定週期的波型,將整個聲波切為數個小區塊(Frame), 每個區塊包含512點,兩兩之間有83點重合之後 每個區塊經過自相關演算(Autocorrelation) 將中央原點附近的訊號濾除以求得每一個小區塊的週期,並藉以得到每個區塊的頻率。 最後我們累積所有區塊頻率,得到輸入聲波的基頻分佈圖

基頻粹取 濾除中央微弱訊號前 濾除中央微弱訊號後

轉換成中介格式 針對一般人唱歌的頻域,將過高(大於1043HZ)或過低(小於82HZ)的頻率濾掉,並經過適當的平滑、刪除錯誤的訊號、降低取樣頻率後 ,轉換成和音樂資料庫中相同的中介格式

搜尋比對程序 由於每位使用者的音域不同,在哼唱時,往往造成基調的變異。 主要要克服的便是使用者基調及節奏速度不同所造成的問題。 輸入聲波的平均值平移至和歌曲相同,並同時定義出一個搜尋區間 以二位元搜尋法(Binary search)藉以在log(N)的時間內找到最適當的基調

搜尋比對程序 二位元搜尋法

調整基調範例