Presentation is loading. Please wait.

Presentation is loading. Please wait.

整合性封包保護機制提升語音通訊之品質 Ren-Yuh Lu.

Similar presentations


Presentation on theme: "整合性封包保護機制提升語音通訊之品質 Ren-Yuh Lu."— Presentation transcript:

1 整合性封包保護機制提升語音通訊之品質 Ren-Yuh Lu

2 Outline Introduction Related Work 整合性封包保護機制提升語音通訊之品質
MANET Motivation & Objective Problem Description Related Work Reliable Blast UDP Partial-Reliable TCP 整合性封包保護機制提升語音通訊之品質 分辨重要封包的方法 整合性封包保護技術 Evaluation & Performance Analysis

3 Introduction VoIP ( Voice over IP ) 是一種透過網際網路以數位化的方式來傳輸語音封包的技術。
本研究是為了使VoIP能夠在High Loss Rate的網路環境下更順暢地運作所設計。 VoIP運作在High Loss Rate的網路環境中會遇到一些問題,我們將以MANET作為例子加以說明。

4 MANET MANET 「群組行動電腦網路」是一種行動式無線區域網路,對群組行動使用者提供一個可在行動中使用的電腦網路。
一個 MANET 係由一組行動電腦 ( 筆記型電腦或 具有 WiFi能力的 PDA手機 ) 組成, 其間以 Multi-Hop Ad-Hoc 無線區域網路連結成 Wireless Intranet。 各個行動電腦之間可藉由高速的 Wireless Intranet 進行即時多媒體網路通訊。

5 Motivation & Objective
High Loss Rate的網路環境,例如MANET,具有以下的缺點: 錯誤率很高 沒有Server管理節點 在這樣的網路環境中使用VoIP,會有一些問題需要克服。

6 Problem Description VoIP對時效性的要求極高,為了符合這個要求,現今的VoIP系統大部份都使用UDP傳輸層協定。
不保證一定送達 如果VoIP運用在錯誤率很高的網路環境時,可能會因為遺失太多封包而影響通話品質。 我們即將研究一些機制用以提高VoIP的品質。

7 Related Work Reliable Blast UDP Partial-Reliable UDP VAD
Energy-based VAD Entropy-based VAD

8 Reliable Blast UDP

9 Partial-Reliable TCP

10 VAD Voice Activity Detection Time Domain VAD技術 Frequency Domain VAD技術

11 Time Domain VAD 在擷取語音Frame但尚未壓縮之前,就利用某些特徵判斷封包的重要性。
語音通訊有時效性,即傳輸的Delay Time不能趟長,則用來暫存語音Frame的Buffer不能太長。

12 Time Domain VAD 這類型的方法較為簡單,但是當信號雜訊比 ( SNR ) 較低時或能量變化較快速時 ( 即背景噪音較高時 ) 此法較不適用。

13 Frequency Domain VAD 在噪音較高的情況下,就要藉助於Frequency Domain的分析分辨語音與噪音。
假設噪音的頻譜與White Noise相似,而語音的頻譜則集中在40Hz至4000Hz之間,我們將以Entropy之值作為分辨語音與White Noise的參數。

14 Frequency Domain VAD — Entropy-Based
An Example of Entropy: The entropy of class A is bigger than the entropy of class B. Class 1 Class 2 Name Score Joe 99 Mary 28 Steven 84 Mark 42 Alice 15 Brian 72 Name Score Carlo 70 Drew 58 Elsa 66 Harry 61 Jack 69 Lucy 55

15 整合性封包保護機制

16 整合性封包保護機制 假設除了人聲之外,其他聲音均視為噪音。
我們即將研究一個分辨重要封包的方法,可能搭配Partial-Reliable UDP,保證能夠維持VoIP的通訊品質。 分辨重要封包的方法 VAD ( Voice Activity Detection ) 整合性封包保護技術 Partial-Reliable UDP Different Codec Technologies

17 分辨重要封包的方法 之後要自己做 分成室內室外等等 分析其特徵 依分析的困難度來區分

18 VAD The Feature of Entropy-Based VAD 混合式VAD技術 個性化VAD技術

19 The Feature of Entropy-Based VAD
優點: 對Noise的變動較不敏感,即使雜訊嘈雜且不規則,本方法仍然有效。 即使訊號的SNR較差,仍然可以分辨Speech Segment或non-Speech Segment。 缺點: 需要耗費龐大的計算資源。 可能會使VOIP的即時性減低,封包的Delay會大幅增加。 若收音器處於非常嘈雜且噪音相當不規則的環境下(Ex:White Noise加Colored Noise),可能會造成non-Speech Segment和Speech Segment的Entropy值接近,而導致辨識上的錯誤率增加。

20 混合式VAD 針對SNR高且Noise變化小,或雜訊頻寬接近語音頻寬的Colored Noise的環境,使用Energy-Based VAD。 節省運算資源。 避免判斷的正確性受到過於接近的語音頻譜的雜訊影響。 若發話端SNR較低或Noise變化較大,但雜訊特性為頻寬較寬的White Noise時,使用Entropy-Based VAD。 避免變化迅速的Noise振幅影響判斷正確率。 若Noise振幅和雜訊頻譜皆不穩定,則將兩種VAD混合使用。

21 Characteristic VAD 假設在每個傳送端由於發話地點環境的差異,都存在不同特性 ( 頻譜與振幅 ) 的Noise。
Method 1 Method 2

22 Characteristic VAD — Method 1
在傳送端先分析Noise特性,在傳送時用來過濾Noise。 Noise Cancellation

23 Characteristic VAD — Method 2
使用兩個麥克風分別收音,一個收錄背景雜音,一個收錄說話人聲,再利用Voice Cancellation濾除Noise。 Clean & Background Noise Cancellation

24 整合性封包保護技術

25 整合性封包保護技術 Model: 1. 定義基本封包間隔時間 ( msec / packet ),簡稱為「基本時隔」最常用的基本時隔為 20 ( ms/packet ) 及30 ( ms / packet )。 2. 將Redundant Voice Packets視為不同的Packet Stream。 3. 不同的Voice Packets可用不同的壓縮碼 ( Codec )。 4. 所有的Packet Stream的時隔應為基本時隔的倍數。 5. 定義第一個Packet Stream為基本Stream。 6. 其他的Packet Stream稱為Redundant Stream,彼此之間相差至少一個時隔。 7. 最後,將所有Packet Stream Piggyback在一起,變成一個時隔為基本時隔的單一Packet Stream。

26 Example 1 — Redundancy Only
Voice Stream 2 1 2 3 4 5 6 Voice Stream 1 1 2 3 4 5 6 7 20 40 60 80 100 120 Time ( msec ) Voice Stream 1 2 1 3 2 4 3 5 4 6 5 7 6 20 40 60 80 100 120 Time ( msec )

27 Example 2 — Different Codec & Redundancy
Voice Stream 3 1+2+3 4+5+6 Voice Stream 2 1 2 3 4 5 6 Voice Stream 1 1 2 3 4 5 6 7 20 40 60 80 100 120 Time ( msec )

28 Example 2 — Different Codec & Redundancy
Voice Stream 3 Voice Stream 2 Voice Stream 1 1 2 1 3 2 4 3 5 4 6 5 7 6 1+2+3 4+5+6 20 40 60 80 100 120 Time ( msec )

29 Example 3 — VAD & Redundancy
Voice Stream 2 1 2 3 4 5 6 Voice Stream 1 1 2 3 4 5 6 7 20 40 60 80 100 120 Time ( msec ) Voice Stream 1 2 1 3 2 4 3 5 4 6 5 7 6 20 40 60 80 100 120 Time ( msec )

30 Different Codec Technologies

31 多媒體壓縮格式列表

32 ITU-T Codec技術比較表 編碼與位元傳輸速率 (Kbps) 編碼取樣大小 (Bytes) 編碼取樣間隔 (ms) Mean
Opinion Score (MOS) 語音Payload大小 語音Payload長度 每秒封包數 (pps) Bandwidth Ethernet (Kbps) G.711 (64Kbps) 80 10 4.1 160 20 50 87.2 G.723.1 (5.3Kbps) 30 3.8 34 20.8 (6.3Kbps) 24 3.9 21.9 G.726 (24Kbps) 15 5 -- 60 47.2 (32Kbps) 3.85 55.2 G.728 (16Kbps) 3.61 61.5 G.729 (8Kbpps) 3.92 31.2 .一般用來衡量 通話品質的指標有MOS(Mean Opinion Score)、(DRT)Dynamic Rhyme Test、及DAM(Diagnostic Acceptability Measure)等。

33 ITU-T Codec技術探討 G.711 G.723.1被廣泛運用在電話閘道器上,為一種高品質高壓縮型的壓縮技術。
A-Law:常用於歐洲國家 Mu-Law:常用於北美及日本 G.723.1被廣泛運用在電話閘道器上,為一種高品質高壓縮型的壓縮技術。 G.726為G.721和G.723的合體,常用於DECT無線網路電話和Canon相機。 G.729較常使用於VoIP,標準的bit rate是8Kbps ,但也支援6.4Kbps和11.8Kbps, G.729 annex B並包含有VAD的功能。

34 G.729 Annex A ( G.729.A ) Annex B ( G.729.B ) Annex D ( G.729.D )
G.729 Complex Codec Annex B ( G.729.B ) VAD ( Voice Activity Detection ) DTX ( Discontinuous Transmission ) 不傳任何東西或傳一個SID Frame SID Frame 包含了 Generate Comfort Noise CNG ( Comfort Noise Generation ) Annex D ( G.729.D ) Bit Rate比G.729低,為64bits/frame,頻寬為6.4Kbps Annex E ( G.729.E ) Bit Rate比G.729更高,為118bits/frame,頻寬為11.8Kbps

35 Internet Low Bit Rate Codec
iLBC Internet Low Bit Rate Codec Data Frame ( ms ) 20 30 Sampling Frequency ( 8 KHz / 16 bit ) 160 samples 240 samples Fixed bit rate ( Kbit / s ) 15.2 13.33 Fixed Frame Size ( Bits per block ) 304 400 Mean Opinion Score ( MOS ) 4.14 --

36 Evaluation & Performance Analysis

37 Evaluation & Performance Analysis
定義效能評估指標: VoIP PSNR VAD 語音辨識率 Redundancy Cost vs Packet傳輸成功率 P-R UDP 重要封包到達率 搭配不同技術,就要以不同的指標組合衡量效能。

38 VoIP指標 — PSNR

39 VAD指標 — 語音辨識率

40 Redundancy指標 — Cost vs 總封包傳輸成功率

41 P-R UDP指標 — 重要封包傳輸成功率

42 Evaluation & Performance Analysis
VoIP + 其他使用技術 觀察指標 Redundancy PSNR + Cost vs 總封包傳輸成功率 VAD PSNR + 語音辨識率 P-R UDP PSNR + 重要封包傳輸成功率 Redundancy & PSNR + Cost vs 總封包傳輸成功率 + 語音辨識率 PSNR + Cost vs 總封包傳輸成功率 + 重要封包傳輸成功率 VAD & PSNR + 語音辨識率 + 重要封包傳輸成功率 PSNR + Cost vs 總封包傳輸成功率 + 語音辨識率 + 重要封包傳輸成功率

43 實驗環境設計 環境限制: Max Delay Time不能超過300ms。


Download ppt "整合性封包保護機制提升語音通訊之品質 Ren-Yuh Lu."

Similar presentations


Ads by Google