Advanced Query by Humming System(QBH)

Slides:



Advertisements
Similar presentations
第一讲:导论 The Introduction  哲学与中国哲学  哲学与哲学史  中国哲学史的历史.
Advertisements

S.1 封面 S.2 目錄 S.3 個案一 S.4 個案二 S.5 感想 S.6 社會的行動 S.7 政府的行動 S.8 活到老 學到老 S.9 總結 S.10 老?!
數位訊號處理概論 [ 音樂情感 Music Emotion ] 資工三甲 4A1G0030 李裕家 1.
青蘋果的代價 參考資料 : 國中性教育教學輔助媒體 (Power Point) 教師手冊. 影片欣賞 -- 愛的晚霞 單純的阿霞人生第一次的愛情,卻是帶來身心嚴重 的傷害,阿霞要如何面對感染愛滋後的生活 …
不知者無罪嗎 ? 【本報台北訊】國內知名大學胡姓研究 生進口豬籠草在網路上販售,涉嫌違反 植物防疫檢疫法,胡姓研究生表示不知 道豬籠草是違禁品並當場認錯道歉 台北地檢署檢察官念他初犯,昨 天處分緩起訴,但命他繳交六萬 元緩起訴處分金作公益。 豬籠草有潛移性線蟲寄生,一旦植物感 染後,輕則枯萎凋零,重則危害農業經.
审核评估释义 余国江 教学质量监控与评估处.
班級:xxx 組別:第x組 報告:ooo、ooo
什么是伸展? 无论你是久坐的生活型态或是爱好运动的人,伸展可让你身体柔软,为接下来的动作做好准备,也可以让运动后的肌肉柔缓放松。
企业涉税业务基本知识宣传 郑州航空港区国家税务局机场税务分局 王 磊.
小組課業 電腦在教學上的應用 Power Point 導師: 黎耀志先生.
307暑假作業 自選部份,各項的範例!.
成都市现代制造职业技术学校 强抓职教师资建设 提升教师队伍素质 ——青年教师队伍长成记 主讲人:游 宏.
Classification of Web Query Intent Using Encyclopedia 基于百科知识的查询意图获取
Mathematical Analysis 財金案例的應用
家庭與婚姻 組員名單:鄭會成(2) 吳天雄(7) 鄭曉娜(10) 黃海瑩(34) 葉頌秋(41).
手巾比紙巾環保 但不衛生.
桌球腳步練習(熱身操) 1.單步(近檯,踏出一步) 跟步(近到中檯,踏出二步) 11
其他电感式 测微头 电感测微器(位移测量) 红宝石测头 航空插头.
模式识别 – 概率密度函数的参数估计 第三章 概率密度函数的参 数估计. 模式识别 – 概率密度函数的参数估计 3.0 引言 贝叶斯分类器的学习:类条件概率密度函数的 估计。 问题的表示:已有 c 个类别的训练样本集合 D 1 , D 2 , … , D c ,求取每个类别的类条件概率密 度 。
「品格教育的理念與實踐」研討會 心得分享:羅旭壯 96年5月14日(一).
特殊教育課程與教學調整現場實務 特教小組 執行秘書 林坤燦.
產品調查科~ 包裝紙巾大搜查 第3组 馮鎧洳 鄧穎怡 組長*香凱文 周庭欣 詹卓穎.
羽绒服海外销售 上海 德国汉堡 小组成员: 刘 娟 叶冬仪 谢洁霞 李洁茗 林佩旋 梁丽枝 简伟钳.
实践 课题 周围环境对当代大学生成长的影响 指导老师:王永章 小组成员:陈荣、刘若楠、张红艳、吕雪丹、樊金芳、李惠芬、黄婧
Mode Selection and Resource Allocation for Deviceto- Device Communications in 5G Cellular Networks 林柏毅 羅傑文.
XI. Hilbert Huang Transform (HHT)
Leftmost Longest Regular Expression Matching in Reconfigurable Logic
A Novel Geographic Routing Strategy over VANET
Signal and Systems 教師:潘欣泰.
A TIME-FREQUENCY ADAPTIVE SIGNAL MODEL-BASED APPROACH FOR PARAMETRIC ECG COMPRESSION 14th European Signal Processing Conference (EUSIPCO 2006), Florence,
A Question Answering Approach to Emotion Cause Extraction
Visualizing and Understanding Neural Machine Translation
IV. Implementation IV-A Method 1: Direct Implementation 以 STFT 為例
Applications of Digital Signal Processing
毕业论文报告 孙悦明
SPC introduction.
非線性規劃 Nonlinear Programming
WiFi-Enabled Smart Human Dynamics Monitoring
GoldWave 音樂編輯軟體 -演算法與技巧- 學生: 冼達 指導教授: 丁建均 DISP, NTU 2018/11/20.
研究、論文、計畫與生活之平衡 演講人:謝君偉 元智大學電機系 2018年11月22日.
Wavelet transform 指導教授:鄭仁亮 學生:曹雅婷.
基督教 宣道會 南港堂 主日服事注意要項 ◆ 聚會程序與時間 ◆ 講員 ◆ 領會同工 ◆ 領敬拜同工 ◆ 司琴同工 ◆ 放投影片同工
A Study on the Next Generation Automatic Speech Recognition -- Phase 2
The First Course in Speech Lab
Artificial Intelligence - 人工智慧導論
DIY Stroke Recognizer.
VIDEO COMPRESSION & MPEG
建国以来,大陆对台政策 金亚丽 周莎 黄运娜.
Mechanics Exercise Class Ⅰ
找人随时随地 完善的控制权限 通讯录信息字段自定义 支持各种组织架构 支持既有人事系统.
Research 裴澍炜 Shuwei Pei Tel:
表情识别研究 Sources of facial expressions
行政管理者 的素质要求 中南大学湘雅医院 李远斌
Learn Question Focus and Dependency Relations from Web Search Results for Question Classification 各位老師大家好,這是我今天要報告的論文題目,…… 那在題目上的括號是因為,前陣子我們有投airs的paper,那有reviewer對model的名稱產生意見.
NSC D 蔣依吾 中山大學資訊工程系 紅外線點目標的檢知法則 Automatic detection of small targets in infrared image sequences containing evolving cloud clutter NSC D
吸毒的禍害 華德學校 5A 陳家韻 (3).
A Data Mining Algorithm for Generalized Web Prefetching
An Efficient MSB Prediction-based Method for High-capacity Reversible Data Hiding in Encrypted Images 基于有效MSB预测的加密图像大容量可逆数据隐藏方法。 本文目的: 做到既有较高的藏量(1bpp),
以四元樹為基礎抽取圖片物件特徵 之 影像檢索
 隐式欧拉法 /* implicit Euler method */
博愛醫院鄧佩瓊紀念中學 音程.
IV. Implementation IV-A Method 1: Direct Implementation 以 STFT 為例
介入及追蹤紀錄表 編號: 姓/稱謂: 初次103年 月 日 追蹤 月 日 問題型態 (可複選) □ 1. 覺得西藥都很傷胃
Speaker : YI-CHENG HUNG
音樂之旅 第一冊 單元五 級進、跳進、旋律動向.
語音訊號的特徵向量 張智星 多媒體資訊檢索實驗室 清華大學 資訊工程系.
第三章 音樂檢索技術 1) 內涵式音樂資訊檢索(content-based music information retrieval)
「同根同心」- 交流計劃 廣州及珠三角經濟發展兩天考察團 2016
HRNet 保持高分辨率 不同分辨率之间进行信息交换(exchange) Exchange Unit HRNet Exchange Block.
禮儀與聖事.
Presentation transcript:

Advanced Query by Humming System(QBH) 電信所一 王治皓

參考 Advanced Query by Humming System Using Diffused Hidden Markov Model and Tempo Based Dynamic Programming (Chiao-Wei Lin, Jian-Jiun Ding, and Che-Ming Hu) Improved Onset Detection Algorithm based on Fractional Power Envelope match Filter (Jian-Jiun Ding , Che-Ming Hu , Ta Hsien , and Chi-Jung Tseng ) Youtube影片

大綱 onset detection(起始檢測) pitch estimation(音調提取) melody matching(旋律匹配)

Abstract QBH是基於內容(content-based)來判斷哪首歌 本文改利用音符(note-based)來判斷 透過使用時頻分析來找出在Time domain難找到的起始點 除了音調,速度也是可以拿來判斷的依據

Introduction 把信號分割成一個一個音符 signal note

The note-based methods mainly include three parts: onset detection,1(起始檢測) pitch extraction2(音調提取) and melody matching3(旋律匹配).   5.In order to enhance the system speed and accuracy, we propose a two-stage matching QBH system. We apply the hidden Markov model (HMM) as the first stage to filter out the unlikely songs in target. The flowchart of our proposed system is shown as in Fig. 1.

onset detection 困難處 當信號能量變化不大時,難以檢測出onset point Thrill(顫抖音)和 end tone of the music signal 容易使我們誤判 onset point The note-based methods mainly include three parts: onset detection,1(起始檢測) pitch extraction2(音調提取) and melody matching3(旋律匹配).   5.In order to enhance the system speed and accuracy, we propose a two-stage matching QBH system. We apply the hidden Markov model (HMM) as the first stage to filter out the unlikely songs in target. The flowchart of our proposed system is shown as in Fig. 1.

Proposed method (for onset detection) Difference of magnitude Short-term energy HFC method Surf method Proposed method 與方法1較類似 difference of magnitude 是去計算出兩個時槽間的envelope amplitude 的差值 Short-term energy 類似於第一個方法,是算出兩個時槽能量的差值 HFC 是透過觀察頻率有沒有高頻的成分來判斷 Surf 觀察envelope的斜率來判斷

(Step1)find the envelope amplitude for each time slot (Step1)find the envelope amplitude for each time slot. 類似於Difference of magnitude 可以提step1少掉LPF是為了減少計算時間,但是同時也還會減少noise的影響 N0是timeslot寬度 STEP2之前有先做過normalize

(Step2)Take the fractional power of the envelope amplitude. 假設Ak = 0 (Step2)Take the fractional power of the envelope amplitude. 假設Ak = 0.12, Ak1 = 0, Ah = 0.52, and Ah1 = 0.4.  = 0.7 Dk =Ak –Ak1 =0.12 Dh = Ah –Ah1 =0.12 Bk =0.1995 Bh =0.1062 可以提step1少掉LPF是為了減少計算時間,但是同時也還會減少noise的影響 N0是timeslot寬度 STEP2之前有先做過normalize

(Step3)跟match filter做convolution (Step3)跟match filter做convolution. f[n] = [3, 3, 4, 4, -1, -1, -2, -2, -2, -2, -2, -2]. (Step4) 如果convolution的值大於thd,我們就可以把第K點當 作onsetpossible1. 可以提step1少掉LPF是為了減少計算時間,但是同時也還會減少noise的影響 N0是timeslot寬度

(Step5) Ck :convolution of envelope and envelope matched filter Max(i) and Min(i) : the i-th peak in Ck. 計算差值,如果大於THD則判斷為onsetpossible2

時域上可能的起始點會在onsetPossible1 or onsetPossible2 如果Ck<thd1 但 > thd2 代表可能有缺失onset point,我們可 以用STFT去觀察頻率是否顯著變化考慮增加新的onset point, 及代表出現新的note。

The note-based methods mainly include three parts: onset detection,1(起始檢測) pitch extraction2(音調提取) and melody matching3(旋律匹配).   5.In order to enhance the system speed and accuracy, we propose a two-stage matching QBH system. We apply the hidden Markov model (HMM) as the first stage to filter out the unlikely songs in target. The flowchart of our proposed system is shown as in Fig. 1.

Proposed method (for pitch estimation) 對每個音符做傅立葉轉換,並取得前三個local maximum。最 低的選擇作為基本頻率。

Tempo Feature 除了音調之外,速度也是歌曲的重要組成部分。如果有兩個相 同的音調序列,每個音符的速度不同,它們仍然是不同的歌曲。

飄向北方 一是鄧子棋&黃明志 二是小小兵 三是0.9倍速

The note-based methods mainly include three parts: onset detection,1(起始檢測) pitch extraction2(音調提取) and melody matching3(旋律匹配).   5.In order to enhance the system speed and accuracy, we propose a two-stage matching QBH system. We apply the hidden Markov model (HMM) as the first stage to filter out the unlikely songs in target. The flowchart of our proposed system is shown as in Fig. 1.

Hidden Markov Model 傳統HMM的小麻煩 解決方案 :使用diffusion matrix 傳統HMM對唱錯音跟音符有多或少都不太能work得太好 當轉移發生的時候,我們會把可能發生的機率範圍擴大

The note-based methods mainly include three parts: onset detection,1(起始檢測) pitch extraction2(音調提取) and melody matching3(旋律匹配).   5.In order to enhance the system speed and accuracy, we propose a two-stage matching QBH system. We apply the hidden Markov model (HMM) as the first stage to filter out the unlikely songs in target. The flowchart of our proposed system is shown as in Fig. 1.

Dynamic Programming 為了解決人們可能用不同key唱歌的問題,使用音符的音調間隔 作為音高特徵。 由於人們對音調比節奏更敏感,所以DP的匹配過程主要是基於音 調間隔矩陣。 PitchInterval表示query and target半音不同的數量 MappingBeat表示query and target速度的差距。

為甚麼要用two stage melody matching? HMM :速度快,幫助我們快速篩選不可能的歌曲。 DP :速度慢,但識別率很高。 (第一階段HMM被用作在數據庫中篩選不可能的歌曲,數據庫中只有一小部分歌曲將存活到下一階段,第二階段是DP處理以進行更準確的匹配。)

The note-based methods mainly include three parts: onset detection,1(起始檢測) pitch extraction2(音調提取) and melody matching3(旋律匹配).   5.In order to enhance the system speed and accuracy, we propose a two-stage matching QBH system. We apply the hidden Markov model (HMM) as the first stage to filter out the unlikely songs in target. The flowchart of our proposed system is shown as in Fig. 1.

output 在確定了第二階段的匹配分數之後,最終的結果將會參考第一階 段HMM的分數與第二階段DP的分數綜合起來決定。 由於HMM影響較少,故DP分數的權重較HMM高。

其他能改進的地方 根據人們唱歌的習慣,可以把onset point 設在一開始或副歌。

The note-based methods mainly include three parts: onset detection,1(起始檢測) pitch extraction2(音調提取) and melody matching3(旋律匹配).   5.In order to enhance the system speed and accuracy, we propose a two-stage matching QBH system. We apply the hidden Markov model (HMM) as the first stage to filter out the unlikely songs in target. The flowchart of our proposed system is shown as in Fig. 1.

其 他 方式 Precision :正确被检索的item(TP)"占所有"实际被检索到的(TP+FP)"的比例. Recall :正确被检索的item(TP)"占所有"应该检索到的item(TP+FN)"的比例。

The note-based methods mainly include three parts: onset detection,1(起始檢測) pitch extraction2(音調提取) and melody matching3(旋律匹配).   5.In order to enhance the system speed and accuracy, we propose a two-stage matching QBH system. We apply the hidden Markov model (HMM) as the first stage to filter out the unlikely songs in target. The flowchart of our proposed system is shown as in Fig. 1.

10-second case. 20-second case. Method MRR DP 0.725 HMM 0.577 LS 0.639 [14] 0.728 [15] 0.750 [16] 0.742 Proposed Method 0.774 Method MRR DP 0.803 HMM 0.743 LS 0.754 [14] 0.831 [15] 0.941 [16] 0.929 Proposed Method 0.983 MRR是一個messurement用來衡量結果的正確性

回顧

總結 透過使用時頻分析(STFT)觀察頻率的變化,找出在Time domain難找到的onset point。 人們對於音調的變化比起節奏的變化更為敏感。 使用2階段melody matching的原因是因為HMM(快速篩掉不 對的歌曲)與DP(速度較慢但精準高)的特性。