VI. Brief Introduction for Acoustics

Slides:



Advertisements
Similar presentations
广西大学 普通话培训课件 执教 : 赫英娜. 普通话强化培训 标标准普通话定义:  以北京语音为标准音,以 北方话为基础方言,以典范的 现代白话文著作为语法规范。
Advertisements

演讲是面镜子 四、演说基本功. 演讲是面镜子 演说基本功 (一)脑的训练 (二)口语表达的训练 (三)态势语的训练 ( 四)演说心理训练.
國立交通大學應用數學系 數學建模與科學計算研究所 簡 介. 隨著科技的日新月異,人類為追求完美的生活,其 所面臨的科學與工程問題也日趨複雜,舉凡天氣的 預測、飛機的設計、生物醫學中的神經網路、奈米 材料的研發、衍生性金融產品的定價、甚至交通流 量的監測等問題,透過「數學建模」的量化過程, 再配合以「科學計算」的方式去模擬現象並嘗試尋.
语言训练 深圳市特殊需要儿童早期干预中心 黄彬. 什么是语言  语言:它是一种符号,用来表达人类思想和 感情,做为人类交谈或相互传递信息的沟通 工具。是人类的思维工具和最重要的交际工 具。  广义:口头语言、书面语言、表情、手势、 信号、标志、音乐、图画、雕刻等  狭义:口头语言.
苏少版《音乐》教材分析与 教学研究 江苏省中小学教研室 戴海云. 提 纲 第一部分 《音乐》教材分析 编写思路 主要特点 第二部分. 《音乐》教学实验与研究 教学研究 案例分析.
Final Review Chapter 1 Discrete-time signal and system 1. 模拟信号数字化过程的原理框图 使用 ADC 变换器对连续信号进行采样的过程 使用 ADC 变换器对连续信号进行采样的过程 x(t) Analog.
一、音调  听过女高音和男低音的歌唱吗?他们的声音 给你的印象是怎样的? 女高音:音调高, 男低音:音调低,比较低沉。
注音符號教學策略.
只有今天的课堂上勇于动脑思考、通过自己的发现获得知识奥秘的小朋友才有资格进去!而且还要通过智慧公主的种种挑战,你们有信心吗?
The Fifth Period   1. 祈 使  句   2. 名 詞 子 句.
課程名稱:多變的聲音 編授教師: 中興國中 楊秉鈞.
數位訊號處理 第4章 離散時間訊號與LTI系統之傅利葉分析
“乐圣”贝多芬用它的智慧谱写的《命运交响曲》告诉我们:向命运呐喊,向命运抗挣,我们会胜利的,前面就是美好和幸福。
小学语文毕业总复习 ( 基础知识部分) 牡丹区实验小学侯宪梅.
民间器乐 第五章.
普通话测试 普通话测试培训 安康职业技术学院 黄超男 QQ:
数字图像处理 Digital Image Processing.
十八岁和其他.
朗读基本技巧与朗读教学.
“国培计划(2012)”—幼儿园骨干教师远程培目
字词积累与词语运用.
孔子傳第三集: 興辦私學-禮學之美 生命教育工作坊.
國語正音與注音符號教學研習 國立台中教育大學 語文教育學系 施枝芳.

提升國小自然與生活科技領域教師教學智能研習
國三第五課 亞洲音樂漫遊.
此课件由360大课堂 隆 中 对.
如何指導學生 國語朗讀 講師:臺中市 東光國小 黃千洪.
中华全国魅力女性演说能力训练专题讲座YANSHUONENGLIZHUANJIANG
XI. Hilbert Huang Transform (HHT)
Signal and Systems 教師:潘欣泰.
A TIME-FREQUENCY ADAPTIVE SIGNAL MODEL-BASED APPROACH FOR PARAMETRIC ECG COMPRESSION 14th European Signal Processing Conference (EUSIPCO 2006), Florence,
Applications of Digital Signal Processing
V. Homomorphic Signal Processing
XVI. Applications of Wavelet Transforms
計算機概論 蘇木春 中央大學資工系.
Differential Equations (DE)
Different Codec Technologies
32位元處理器之定點數MFCC演算法的改進與探討 Improvement and Discussion of MFCC Algorithm on 32-bit Fixed-point Processors 學生:陳奕宏 指導教授:張智星.
II. Short-time Fourier Transform
漢語拼音練習 ㄅㄆㄇㄈ b p m f.
VI. Brief Introduction for Acoustics
大調音階 李金桂 製作.
一般論文的格式 註:這裡指的是一般 journal papers 和 conference papers 的格式。
An en in 你发现了什么?. an en in 你发现了什么?
第二週 記譜法.
Advanced Digital Signal Processing 高等數位訊號處理
Lesson 8 天氣的用法.
XIV. Orthogonal Transform and Multiplexing
What Day Is Today? ~Lesson Four~.
VII. Data Compression (A)
目錄 第一教節 圖片 詞卡: 前途 潛逃 圖紙 桃子 報名 部門 拼音卡 第二教節 銀行存摺 詞卡: 紅包兒 花 攢 第三教節
神秘岛.
卷四 課堂語言運用 大綱: (甲) 觀課安排及程序 (乙)「課堂語言運用」評估範疇 大綱: (一) 觀課安排及程序
羊樂多笛笛 作者:吳滋錕、劉智昇.
农业的变化 真大.
10、《论语》十二章.
96學年度第二學期電機系教學助理課後輔導進度表(一)(查堂重點)
人民音乐出版社 七年级.
資料表示方法 資料儲存單位.
語音訊號的特徵向量 張智星 多媒體資訊檢索實驗室 清華大學 資訊工程系.
國立苑裡高中 基礎物理講義 聲音(週期波)三要素 噪音
II. Short-time Fourier Transform
企劃人員應該具備什麼能力呢??.
复习四 拼音宝宝的聚会.
裕民國小 100學年度第一學期 多元文化社團 直笛社團&合唱社團 期末成果發表會
ㄉㄞ_ ㄧ ㄍㄨㄚ 台 語 歌 dai_ qi gua ㄒㄧㄤ_ ㄢ^ ㄧ ˋ 雙 雁 影 ※台語歌詞 發音會因旋律 影響轉變聲調
教育部 104年數位學伴線上課業輔導服務計畫 教學科目:英文 教學單元:現在式 教學者: 學習者: 本教材可配合小學伴課本參考使用
A o e i u ü 单韵母 ei ai ui 复韵母 ao ou iu ie üe er 特殊韵母.
汉语拼音总复习.
Presentation transcript:

VI. Brief Introduction for Acoustics [參考資料] 王小川, “語音訊號處理”,全華出版,台北,民國94年。 T. F. Quatieri, Discrete-Time Speech Signal Processing: Principle and Practice, Pearson Education Taiwan, Taipei, 2005.  L. R. Rabiner and R. W. Schafer, Digital Processing of Speech Signals, Prentice-Hall, 1978.  張智星教授 網頁 http://neural.cs.nthu.edu.tw/jang/  P. Filippi, Acoustics : Basic Physics, Theory, and Methods, Academic Press, San Diego, 1999.

 6-A 聲音的相關常識 197 人耳可以辨識頻率:20Hz ~ 20000Hz 說話:150~2000Hz > 20000Hz: 超音波 (ultrasound) < 20Hz: 次聲波 (infrasound) 波長較長 -> 傳播距離較遠,但容易散射 波長較短 -> 衰減較快,但傳播方向較接近直線

198  一般聲音檔格式: (1) 取樣頻率 22050Hz (2) 單聲道或雙聲道 (3) 每筆資料用8個bit來表示  電腦中沒有經過任何壓縮的聲音檔: *.wav Q: What is the data size of a song without compression?  數位電話取樣頻率:8000Hz

聲音在空氣中傳播速度 : 每秒 340 公尺 (15°C 時) 所以,人類對3000Hz 左右頻率的聲音最敏感 (一般人,耳翼到鼓膜之間的距離: 2.7公分) 附: (1) 每增加 1°C,聲音的速度增加 0.6 m/sec (2) 聲音在水中的傳播速度是 1500 m/sec 在鋁棒中的傳播速度是 5000 m/sec

200 20000Hz 5000Hz 1000Hz 200Hz annoyance curve lower bound for hearing 20Hz 0dB 80dB 110dB

 dB: 分貝 10log10A   每增加 10dB,音強增加10倍;每增加3dB ,音強增加2倍; 所幸,內耳的振動不會正比於聲壓  人對於頻率的分辨能力,是由頻率的「比」決定 對人類而言,300Hz 和 400 Hz 之間的差別,與 3000Hz 和 4000 Hz 之間的差別是相同的

 6-B Music Signal 202 電子琴 Do 的頻率:低音 Do: 131.32 Hz 中音 Do: 261.63 Hz 音樂每增加八度音,頻率變為 2 倍 每一音階有12個半音 增加一個半音,頻率增加 21/12 倍 (1.0595 倍) Do 升Do Re 升Re Mi Fa 升Fa So 升So La 升La Si Hz 262 277 294 311 330 349 370 392 415 440 466 494

203 音樂通常會出現「和弦」(chord) 的現象 除了基頻 f0 Hz 之外,也會出現 2f0 Hz, 3f0 Hz, 4f0 Hz , ….. 的頻率 frequency (Hz)

204 為什麼會產生和弦? 因為聲音信號是一個 periodic signal,但是不一定是 sinusoid A non-sinusoid signal with the period of 1/330 seconds can be expressed as:

 6-C 語 音 處 理 的 工 作 205 (1) 語音編碼 (Speech Coding) (2) 語音合成 (Speech Synthesis) (3) 語音增強 (Speech Enhancement) 前三項目前基本上已經成功 (4) 語音辨認 (Speech Recognition) 音素  音節  詞  句  整段話 (5) 說話人辦認 (Speaker Recognition) (6) 其他:語意,語言,情緒  人耳可以辨識頻率:20Hz ~ 20000Hz 一般人,耳翼到鼓膜之間的距離: 2.7公分 共振:1/4波長

 6-D 語音的辨認 206 音素  音節  詞  句  整段話 音素:相當於一個音標 (1) Spectrum Analysis Time-Frequency Analysis (2) Cepstrum (3) Correlation for Words

ㄅ ㄆ ㄇ ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ ㄐ ㄑ ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ  6-E 子音和母音 ㄅ ㄆ ㄇ ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ ㄐ ㄑ ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ ㄚ ㄛ ㄜ ㄝ ㄞ ㄟ ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ ㄦ ㄧ ㄨ ㄩ   母音: ㄚ ㄛ ㄜ ㄝ ㄞ ㄟ ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ ㄦ ㄧ ㄨ ㄩ 單母音: a, e, i, o, u ㄚ ㄛ ㄜ ㄝ ㄦ ㄧ ㄨ ㄩ 雙母音:ㄞ ㄟ ㄠ ㄡ 母音 + 濁音:ㄢ ㄣ ㄤ ㄥ 子音: ㄅ ㄆ ㄇ ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ ㄐ ㄑ ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ

ㄅ ㄆ ㄇ ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ ㄐ ㄑ ㄒ 漢語拚音 b p m f d t n l g k h j q x 通用拚音 c s ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ ㄚ ㄛ ㄜ ㄝ ㄞ ㄟ ㄠ 漢語拚音 zh ch sh r z c s a o e ai ei ao 通用拚音 jh ㄡ ㄢ ㄣ ㄤ ㄥ ㄦ ㄧ ㄨ ㄩ 漢語拚音 ou an en ang eng er i, y u, w yu, iu 通用拚音

母 音: 依唇型而定 子 音: 在口腔,鼻腔中某些部位將氣流暫時堵住後放開   在頻譜上: 子音的能量小,頻率偏高,時間較短,出現在母音前 母音的能量大,頻率偏低,時間較長,出現在子音後或獨立出現

發音模型 (線性非時變近似)   X(z) = R(z)H(z)G(z)Ep(z) R(z) :嘴唇模型, H(z): 口腔模型, G(z):聲帶模型 Ep(z):輸入(假設為週期脈衝)

 分析一個聲音信號的頻譜: 用Windowed Discrete-Time Fourier Transform 或稱作 Short-Time Discrete Fourier Transform    Discrete-time Fourier transform Windowed discrete-time Fourier transform 強調 n = m 附近的區域 或

典型的聲音頻譜:   頻譜上,大部分的地方都不等於0。 出現幾個 peaks 值 可以依據 peaks 的位置來辨別母音 G(m, f) f F1 F2 F3 F4

母音 peaks 處的頻率 (Hz): 原則上: (1) 嘴唇的大小,決定F1 (2) 舌面的高低,決定 F2  F1 男聲 女聲 F1 F2 F3 ㄚ 900 1200 2900 1100 1350 3100 ㄛ 560 800 3000 730 3200 ㄜ 1090 790 1250 ㄝ 500 2100 600 2400 3300 ㄧ 310 2300 360 3500 ㄨ 370 540 3400 460 820 3700 ㄩ 300 350 2600 ㄦ 580 1500 760 1700

 雙母音: ㄞ (ai), ㄟ (ei), ㄠ (ao), ㄡ (ou) 頻譜隨時間而改變,一開使始像第一個母音,後變得像另一個母音 ㄞ 的頻譜 的 peaks位置 900 310 Time F3 2900 F2 1200 F1

 6-F 語意學的角色 以「語意學」或「機率」來補足語音辨識的不足 例如:經過判定,一個聲音可能是 ㄅㄧ ㄖㄢ ㄆㄧ ㄖㄢ ㄅㄧ ㄖㄢ ㄆㄧ ㄖㄢ ㄅㄧ ㄌㄢ ㄆㄧ ㄌㄢ 這個聲音是「必然」的機率比較大。 ㄅㄛ ㄅㄛ ㄆㄛ ㄆㄛ 可能是「伯伯」,也可能是「婆婆」,看上下文  儲存詞庫  當前主流的語音辨識技術: Mel-Frequency Cepstrum + 語意分析 + Machine Learning (人工智慧的一種)

附錄七:論文英文常見的文法錯誤 (1) *** transform, *** equation, *** method, *** algorithm 在論文當中,當成是可數名詞,而非專有名詞 (除非是所有格的形態)。 可數名詞單數時,前面要要冠詞 (a 或 the) Fourier transform is important for signal processing. (錯誤) The Fourier transform is important for signal processing. (正確) A Fourier transform is important for signal processing. (正確) Fourier transforms are important for signal processing. (正確) I have written the Matlab program of Parks-McClellan algorithm (錯誤) I have written the Matlab program of the Parks-McClellan algorithm (正確) (2) 若是所有格的形態,不必加冠詞 I have written the Matlab program of the Parks-McClellan’s algorithm (錯誤) I have written the Matlab program of Parks-McClellan’s algorithm (正確)

(3) 論文視同正式的文件,對 not, is, are 不用縮寫 they’re (錯誤) they are (正確) he’s (錯誤) he is (正確) aren’t (錯誤) are not (正確) don’t (錯誤) do not (正確) can’t (錯誤) cannot (正確) (4) Suppose, assume 後面要加關係代名詞 Suppose x is a large number. (錯誤) Suppose that x is a large number. (正確) (5) 每一個子句都有一個動詞,而且只有一個動詞

(6) In this paper, in this section, in this chapter 開頭的句子,應該用現在式,而非未來式 In this paper, the fast algorithm of DCT will be introduced. (錯誤) In this paper, , the fast algorithm of DCT is introduced. (正確) (7) 在 conclusion 當中回顧文章一內容,用過去式 (8) 敘述所引用的論文的內容,用過去式 In [10], the number theoretic transform was proposed. (9) time domain, frequency domain 前面也加冠詞 in time domain (錯誤) in the time domain (正確) (10) 不以 “this paper”, “section *”, “Ref. [*]” 當主詞用 This paper describes several concepts. (錯誤) In this paper, several concepts are described. (正確) Ref. [1] proposed the method. (錯誤) In Ref. [1], Parks and McClellan proposed the method. (正確)

(11) 提及某個 equation 時,直接括號加數字即可   in equation (3) (錯誤) in (3) (正確)  提及某個 section, table, or figure 時,前面不加冠詞,而且常用大寫 in the section 4 (錯誤) in Section 4 (正確) in the table 5 (錯誤) in Table 4 (正確) (12) 寫科技論文不是寫文學作品,不要用高明、漂亮、但沒有保握的文法。  儘量用簡單而有把握的文法。 (13) 科技論文英文講求「長話短說」,儘量用精簡的文字來表達意思 (14) 用字儘量避免重覆

F = ma. (15) Equations 也當成是文章的一部分,所以通常也要加標點符號 The formula of Newton’s 2nd law is F = ma. 要加標點符號 (16) 解釋 parameters 和 symbols 時,用 where 當關係代名詞 x = 10t where x is the location of the object and t is time. (17) 很重要的論文,投稿至國際學術期刊,又對自己的英文文法沒有十足的把握時 可以用網路上的論文編修服務,來修改文法上的錯誤 例如 editage,李國鼎科技發展基金會,柯泰德,牛津學社,華樂絲,艾思特等等……. 本系以及台大語言中心也經常有英文論文寫作相關的訓練課程,有志將來在學術界奮鬥的同學,可以多參與相關的課程