認識聲音的原理 認識聲音的形式 認識聲音的儲存格式 認識影像的形式 認識影像的擷取環境 CH7 多媒體 認識聲音的原理 認識聲音的形式 認識聲音的儲存格式 認識影像的形式 認識影像的擷取環境 認識影像的儲存格式 認識視訊的原理 認識視訊的形式 認識視訊的儲存格式
7.1 聲音
7.1.1 聲音的原理
多媒體的重要性 人們靠耳朵聽到外在聲音
聲音的形式 聲音是如何產生的? 聲音是如何傳到我們耳朵裡? 人耳如何聽到聲音?
聲音是如何產生的? 聲音的產生起因於物體振動。 鼓聲由鼓面振動 人聲是聲帶振動 如果一切都是靜止的,就不會有聲音了
聲音是如何傳到我們耳朵裡? 空氣 需要介質
甚麼可以當作介質? 甚麼可以當作介質? 空氣 液體 水 固體 木材 鋼鐵 密度越高,傳遞速度越快 用鐵軌聽火車 快過 用聲音聽火車
人耳如何聽到聲音? 放大聲音震動 聽覺神經解讀 傳遞到耳膜 收集聲波 傳到大腦 資料來源:Simens
人耳如何聽到聲音? 耳朵運作說明 http://www.youtube.com/watch?v=stiPMLtjYAw
7.1.2 電腦聲音的定義
Karajan - Beethoven Symphony No. 5 in C minor Part 1 電腦聲音的定義 聲音的基本樣式 一段時間內,聲波的形式 左圖的聲音來源 http://www.youtube.com/watch?v=pgvpj3NoQF4 Karajan - Beethoven Symphony No. 5 in C minor Part 1 聲波樣式圖
聲音如何儲存在電腦裡? 由於聲音屬於連續類比訊號,而電腦只能接受0與1的數位訊號,因此聲音必須經過數位化才能儲存於電腦。 聲音數位化的過程
聲音如何儲存在電腦裡? 取樣(sampling) 取樣頻率(Sampling Rate) 連續的音響訊號(聲波) 數位的音訊 取樣頻率的設定 取樣頻率(Sampling Rate) 一秒取多少個聲音資料,才不會失真
奈奎斯定理 取樣時的頻率要求? 奈奎斯定理(Nyquist sampling theorem) 一秒取多少個聲音資料,才不會失真 取樣頻率大於原始訊號頻率的兩倍以上,即可達到和原始聲音極為類似的音訊
奈奎斯定理 人類聽覺頻率範圍大約是20KHz 需要40KHz以上的取樣頻率來對聲音作取樣 聲音通常使用44.1KHz/s為取樣頻率 最近的趨勢是使用更高的取樣頻率(大約是基本需求的兩倍或四倍) 尚未有理論支持 在吹毛求疵的聆聽環境下,也難以聽到聲音的差異
CD的取樣頻率為何是44.1KHz CD的取樣頻率是44.1KHz有下列幾種說法 說法一 說法二 為了顧及重建過程中的資訊冗餘問題 說法二 CD發明前的主要數位音訊儲存媒體是錄影帶,以0與1記錄 錄影帶格式為每秒30張,每張分為490條線,每條線儲存三個取樣訊號,因此每秒有30*490*3=44100個取樣點 CD繼承了這個規格
CD的取樣頻率為何是44.1KHz CD的取樣頻率是44.1KHz有下列幾種說法 說法三 說法四 Sony及Philips兩大集團妥協的產物 當時的儲存光碟的技術,最大只有74mins
聲音如何儲存在電腦裡? 量化(Quantization) 量化誤差(Quantization Error) 在每個x軸的取樣點下,將其y軸的高度以一個最接近的量化數字表示 量化誤差(Quantization Error) 在每個x軸的取樣點下,其y軸的量化數字高度與真正數值的差
常見的音訊格式列表 CD audio DAT 取樣頻率(KHz) 44.1 48 取樣量化大小(bits) 16 量化方式 線性量化法 聲道數目 2
聲音儲存在電腦的格式 一般CD的音樂品質 CD audio 規格 44100Hz 16bits量化 左右聲道的取樣頻率 一分鐘的聲音容量大小 =44100(44.1KHz)2(16 bits)2(左右聲道)60(秒) =10584000(Bytes)10MB
不同樂器的音色差異 音色的差別在不同的樂器上很明顯 以A(La)這個音為例 小提琴拉奏、鋼琴彈奏 相似之處(週期相近) 明顯的差別(週期內的波形不同)
單聲道(Mono) 立體聲(Stereo) 5.1聲道 7.1.3 數位聲音的種類 單聲道(Mono) 立體聲(Stereo) 5.1聲道
單聲道(Mono) 一個麥克風錄製 一個喇叭發聲 單聲道在娛樂上 單聲道使用價值 僅能錄製單一聲音資訊 即使使用多個喇叭,因聲音來源僅有一個,仍只有一個訊號,無法感受聲音左右移動的特性 單聲道在娛樂上 已被立體聲或更多的聲道取代 單聲道使用價值 在不須強調立體聲效果,又要降低頻寬的系統上 無線電系統、電話
立體聲(Stereo) 利用二支麥克風收音 比起單聲道而言 1950年代末期,研發立體聲錄音方式 立體聲比起單聲道 有兩個聲道 資訊量多一倍 多了一個聲道以營造出左右音效不同 可以產生動態變化的立體音效 比起單聲道而言 有兩個聲道 資訊量多一倍 檔案大小也多一倍
單聲道能否經由處理轉成立體道? 利用音頻分離技術 此技術能增加單聲道的位置立體感 從單聲道中取出不同的音頻,再依立體聲的產生方式,獲得模擬立體聲的效果 用在古典音樂上 可增加1950年代以前錄音的立體感 此技術能增加單聲道的位置立體感 但比起直接採立體聲錄製的技術,仍有一段差距
不同聲音品質的差異 Karajan 1963 - Beethoven Symphony No. 5 in C minor First movement: Allegro con brio (40秒) 取樣頻率:8000Hz 單聲道 取樣頻率:44100Hz 單聲道 取樣頻率:8000Hz 立體聲 取樣頻率:44100Hz 立體聲
不同聲音品質的檔案差異 錄音品質 檔案大小(mp3) 取樣頻率:8000Hz 單聲道 1.17MB 立體聲道 2.32MB Karajan 1963 - Beethoven Symphony No. 5 in C minor First movement: Allegro con brio 錄音品質 檔案大小(mp3) 取樣頻率:8000Hz 單聲道 1.17MB 立體聲道 2.32MB 取樣頻率:44100Hz 4.89MB 9.64MB
5.1聲道 立體聲可以增加聲音的動態表現 立體聲的缺點 多媒體業者致力於以更多的聲道來提高聽者的音響視聽效果 真實世界的聲音來自前後左右上下 立體聲仍少了一些真實性 多媒體業者致力於以更多的聲道來提高聽者的音響視聽效果 產生5.1聲道 資料來源:http://shopping.udn.com
5.1聲道 運用於各類家庭影院中 常見的聲音錄製壓縮格式 5 聲道 .1 聲道 AC-3(Dolby Digital) DTS 左、右、後左、後右、中置聲道 中置聲道負責傳送低於80Hz的聲音信號,提供在欣賞影片時,優良的人聲效果,並可以把對話集中在整個聲場的中間 .1 聲道 專門設計的超低音聲道 產生頻率範圍在20~120Hz的超低音 資料來源:http://hardware.mydrivers.com
5.1聲道是環繞身歷聲的最高規格嗎? 比5.1聲道更強大的7.1系統已經出現 在5.1聲道上,增加中左和中右兩個發聲位置 缺點 成本比較高 比5.1聲道增加的效果又很有限 目前並沒有廣泛的應用 資料來源:http://premiersupport.dell.com/support/edocs/systems/xlob/mmd/ct/setup_7_1audio.htm
7.1.4 數位聲音的格式
Wave、MIDI、與MP3的格式差異 Wave 微軟公司所制定的聲音規格 電腦的標準聲音格式之一 進入Windows 離開Windows 以取樣及量化的方式記錄 未經壓縮處理,音質方面保留最詳細的數位音效 檔案體積大
Wave、MIDI、與MP3的格式差異 MIDI Musical Instrument Digital Interface 的縮寫 不是直接記錄聲音取樣資料 記錄發聲樂器的種類與樂曲等音符資訊 通常為純音樂 檔案非常小 檔案副檔名為 .mid 藉由專門彈奏MIDI的電子琴,透過連接線與介面卡,可直接將彈奏的內容記錄到電腦內變成MIDI檔案 資料來源:http://iwritethemusic.com/midi.html
Wave、MIDI、與MP3的格式差異 MP3 MPEG Audio Layer 3的壓縮技術 MPEG I(VCD規格)格式中,用來壓縮聲音的技術 利用破壞性壓縮技術,壓縮Wave檔案 還原成Wave檔案與原始的檔案略有不同,但人耳聽起來卻沒有什麼差別 壓縮率為十倍左右 一首五分鐘的歌曲 Wave檔約50MB左右 MP3檔只要5MB
無失真聲音格式 MP3是有失真的聲音壓縮格式 無失真的聲音壓縮格式 FLAC 為Free Lossless Audio Codec縮寫 可自由使用 無失真音頻壓縮編碼 常見於歐美 副檔名:.flac
無失真聲音格式 無失真的聲音壓縮格式 APE Monkey's Audio 目前常見於大陸使用 副檔名:.ape
常見的音訊壓縮格式比較 WAV MP3 FLAC Monkey's Audio 壓縮性質 無失真 失真 壓縮倍率 1 10左右 小於2 WAV MP3 FLAC Monkey's Audio 壓縮性質 無失真 失真 壓縮倍率 1 10左右 小於2 音訊品質 最高 高 副檔名 .wav .mp3 .flac .ape CH01 電腦基本架構
其他常見的數位聲音格式 AU RA RealNetworks公司的音訊壓縮格式 Unix系統上所採用的一種聲音格式 副檔名為 .au 網路上撥放即時聲音檔 RealNetworks公司發展的格式之一 副檔名為 .ra RealNetworks公司的音訊壓縮格式 rm 或 rmvb 資料來源:RealNetworks.com
其他常見的數位聲音格式 AIFF 麥金塔電腦自訂格式 Audio Interchange File Format的縮寫 經由取樣與量化方式 與Wave的檔案格式類似 資料來源:www.apple.com
7.1.5 數位聲音的頻率、頻道與深度
數位聲音的頻率、頻道與深度 聲音檔案大小參數 頻率 頻道 深度 44.1KHz、22.05KHz、11.025KHz、8KHz 立體聲(兩個頻道)與單聲道(一個頻道) 深度 每個聲音的量化參數(16bits 或 8bits)
數位聲音的頻率、頻道與深度 最常見的規格,一分鐘為10.6MB左右 採用單聲道因頻道數目減半 以低品質的11KHz單聲道音訊 44.1KHz、16bits、立體聲 採用單聲道因頻道數目減半 只有一半大小的5.29MB左右 以低品質的11KHz單聲道音訊 一分鐘只要0.66MB 經過Mp3壓縮,容量會縮小成十分之一左右 一分鐘Wave格式檔案大小 量化參數(8 bits) 量化參數(16 bits) 取樣頻率 單聲道 立體聲 11.025 KHz 0.66MB 1.32MB 2.65MB 22.05 KHz 5.29MB 44.1KHz 10.6MB
7.2 影像的形式
7.2.1 影像的定義
影像的定義 影像擷取設備的目的 重要擷取步驟 擷取一般影像成為數位影像 將影像資訊藉由鏡頭,投射在感光元件上 將感應到的訊號強度,利用ADC晶片轉成數位資訊 以DSP晶片記錄成影像格式,儲存在記憶體中
影像的定義 數位相機 以數位方式記錄的設備 傳統相機 以類比方式記錄的設備
數位影像擷取設備的擷取流程 4. 影像格式化:數位訊號處理器 將數位訊號壓縮、格式化,使 其符合影像格式 5. 存入記憶卡:最後將壓縮過後 的檔案存至記憶卡中 DSP 3. 轉換訊號:類比數 位轉換器會將接收 到的類比訊號轉換 成數位訊號,然後 將數位訊號傳送給 數位訊號處理器 ADC 1. 按下快門:光線通過鏡 頭、光圈及快門後,聚 焦在感光元件上 2. 擷取光線:感光元件 會將接收到的光源, 轉換成類比訊號
不同相機的差異 一台數位相機的拍攝品質 光圈的品質 感光元件特性 ADC和DSP晶片的效率 不同品牌的相機拍攝結果差異 明亮、銳利、柔和
數位相機拍攝影像檔案大小 Canon IXUS300 HS 數位相機的拍攝尺寸與檔案大小 影像的精緻程度(拍攝尺寸)與檔案大小成比例 S:0.3M(640x480) M3:2M(1600x1200) M2:4M(2272x1704) M1:6M(2816x2112) L:10M(3648x2736) 影像的精緻程度(拍攝尺寸)與檔案大小成比例 尺寸愈大(愈精緻) 檔案愈大 資料來源:Canon
7.2.2 數位影像的特點
傳統相機特點 傳統相機分為 傳統相機的特點 單眼相機 雙眼相機 使用底片,需要額外成本 洗成照片時,需要底片的沖洗費用與相紙的費用 攝影專業人士使用 雙眼相機 傻瓜相機,一般人使用 傳統相機的特點 使用底片,需要額外成本 洗成照片時,需要底片的沖洗費用與相紙的費用
數位相機特點 使用感光元件及記憶體 影像記錄在儲存媒體 儲存媒體可以重覆使用 感光元件 資料來源:http://blog.dcview.com
傳統相機與數位相機的比較 傳統相機 數位相機 底片需求 需要 不需要 預覽影像 不可 可以 後製處理 不易 容易 網路傳輸 影像品質 佳 傳統相機 數位相機 底片需求 需要 不需要 預覽影像 不可 可以 後製處理 不易 容易 網路傳輸 影像品質 佳 依解析度而定 消耗電量 低 高 沖洗照片品質 較佳
7.2.3 數位影像的原理
數位影像的原理 像素方式表示 將類比的圖像資訊經數位化處理 分析並記錄每一像素點的顏色以獲得一個二維的圖像陣列 一個像素點的色彩由紅(Red)、綠(Green)、藍(Blue)三種元素所組成 每種元素又各區分為256種不同深淺的程度 256種可以用一個Byte表示
數位影像的原理
數位影像的原理 全部的色彩共有2563=16,777,216色(全彩1677萬色) 如果一張影像所需的色彩數目遠小於1677萬色,例如256色 可以使用調色盤來記錄256種不同顏色的RGB數值 每個像素僅需以一個Byte來表示色彩的索引即可 一個Byte可以表示256種可能 可將原本三個Bytes表示一個像素的方式減少為一個Byte來表示一個像素
數位影像的原理 像素圖 以像素為基本單位 放大後會產生鋸齒狀
數位影像的原理 要解決鋸齒問題,須將像素圖改為向量圖 向量圖 以向量方式記錄圖形的所有細節 在局部放大圖中,仍維持平滑的細節
向量圖特性
像素圖與向量圖的差異 像素圖 拍攝而成 放大後會產生鋸齒狀 向量圖 軟體繪製而成 擁有平滑的細節
7.2.4 色彩原理
色彩原理 RGB色彩原理的三原色 紅(Red)綠(Green)、藍(Blue) 三原色 紅 + 綠 = 黃 紅 + 藍 = 紫紅 只要用這三種顏色,可以混合出其他各種顏色 紅 + 綠 = 黃 紅 + 藍 = 紫紅 藍 + 綠 = 青 紅 + 綠 + 藍 = 白
RGB和CMYK色彩的關係 一般色彩的表示須三個參數 印刷系統採CMYK四色 R G B Y(亮度) Cb(藍色偏移量) Cr(紅色偏移量) Y(亮度) U(色度) V(濃度) 印刷系統採CMYK四色 C 青色 M 洋紅色 Y 黃色 K 黑色
CMYK色彩 理論上 但C+M+Y的黑色並不像純黑色般有光澤
RGB和CMYK色彩的關係 同樣都是色彩系統 RGB使用在儲存、顯示影像上 CMYK運用在印刷上
7.2.5 數位影像的格式種類
數位影像的格式的重要 原數位影像 壓縮處理 compression 軟體觀看之數位影像 解壓縮處理 decompression 儲存設備
數位影像的格式差異 壓縮 壓縮可減少檔案量 可表示色彩數 影像的品質 處理時間 處理過程越簡單 處理時間越短
數位影像格式:壓縮 分為無失真、失真兩種 無失真性壓縮(loseless compression) 解壓縮後的影像和原始影像一致,沒有絲毫的不同 檔案壓縮程度非常有限 常見的格式:BMP檔 失真性壓縮(lossy compression) 解壓縮後的影像與原拍攝影像存有差距 差距須控制在人眼無法察覺的程度 壓縮比很大的壓縮方式 常見的格式:JPG檔
數位影像格式:色彩數 全彩標準的色彩數 RGB三色 R:256種 G:256種 B:256種 總共有256×256×256=16,777,216色(1677萬色)
BMP 無失真性壓縮 微軟所提出的點陣圖格式 常見於Windows桌面的底圖格式 缺點是全彩影像不具有壓縮的功能 檔案大(影像佔多少資料量,檔案就有多大) 不適用於網路傳輸上 16色、256色和灰階圖片則可以使用RLE技術壓縮
GIF 失真性壓縮 256色以下無失真壓縮 網頁上常用的影像格式之一 透過色盤數目減少的方式將檔案縮小 GIF最多只儲存256色的數位影像 透明圖(把背景變透明) 交錯圖(在瀏覽器中慢慢顯現) 動畫(把許多GIF圖片連續重疊成一個檔案) 透過色盤數目減少的方式將檔案縮小 GIF最多只儲存256色的數位影像 全彩的影像需先轉為256色、16色、灰階或黑白的影像類型,才能存成GIF檔
GIF色彩 假邊界效應 JPG 原圖 256色GIF圖
GIF色彩 16色GIF圖 黑白GIF圖
PNG 無失真壓縮 近年來由於GIF格式引發權利金的問題,所以PNG格式就成為免費的GIF代替品 網際網路上重要的影像格式之一 具有下列功能 交錯顯示 支援全彩影像的優點 可製作透明的Alpha Channel 目前尚無法儲存動畫
JPG 網頁常用的影像圖形格式之一 壓縮率可達數十倍 採轉換頻率壓縮 影像的細節部份會因壓縮率的提高而損失 1MB的影像,存成JPG檔後可能只剩幾十K 視影像的複雜度及設定的壓縮率而定 採轉換頻率壓縮 影像的細節部份會因壓縮率的提高而損失 JPG 原圖,92354 bytes JPG品質50,48496 bytes
JPG 通常伴隨著影像失真 壓縮率高 壓縮率低 JPG格式支援RGB全彩、灰階等影像類型 以正常的比例壓縮,肉眼很難看出壓縮前後的差異 檔案小 影像品質差 肉眼容易分辨差異 壓縮率低 檔案大 影像較不失真 JPG格式支援RGB全彩、灰階等影像類型 JPG 原圖,92354 bytes JPG品質10,23072 bytes
JPG品質10,23072 bytes
TIF 多家公司共同制訂的格式 目前影像處理界最普遍支援的圖檔格式 特點 跨平台(Windows、UNIX、Mac OS/2皆可使用) 無失真壓縮(可使用LZW、Huffman方法) 適合應用於印刷輸出上 大多數的影像處理軟體及排版軟體都會支援TIF圖檔
TIF TIF支援 TIF檔是圖片做為印刷用途的最好選擇 RGB全彩 256色 16色 灰階 黑白 目前唯有TIF檔能存成16-bits灰階與48-bits的全彩類型 一般的規格為8-bits灰階與24-bits全彩 TIF檔是圖片做為印刷用途的最好選擇
TIF TIF檔,4.03MB (1444×972) TIF檔,LZW壓縮,2.94MB
TIF v.s. JPG TIF檔,LZW壓縮,2.94MB JPG檔,品質5,123KB
TIF v.s. JPG TIF檔,LZW壓縮,2.94MB JPG檔,品質3,93.1KB
UFO PhotoImpact專屬的影像檔案格式 保留PhotoImpact專屬物件系統及其相關設定,以便日後可加以重新編修
PSD Photoshop所製作出來的檔案格式 具有Photoshop中,物件屬性及設定,並可於日後再加以重新編修
7.2.6 數位化影像處理 影像輸入 影像儲存 影像輸出 影像處理
影像輸入 將待處理的影像輸入電腦 常見設備 數位相機 掃描器 將類比影像以「掃描」的方式數位化後,轉成數位化資料儲存電腦
數位相機多已具備人臉搜尋的功能
部份數位相機具有人臉辨識功能
影像儲存 將影像儲存起來,以便日後進一步使用或傳遞 常見的儲存設備:電腦主機內的硬碟 其他的儲存設備 隨身碟 光碟
影像儲存 儲存空間有限 減少資料的佔有空間,並且可縮短傳遞時間 檔案縮小所付出的代價 只要影像品質變差的程度不大,這樣的轉換還是值得的 影像格式的變換 BMP檔改存成JPG檔 壓縮參數調整 JPG檔的影像品質由90降低成25 檔案縮小所付出的代價 影像品質的變差 只要影像品質變差的程度不大,這樣的轉換還是值得的
影像輸出 影像顯示 顯示器 顯示效果因素 愈多「像素」的顯示器與影像顯示卡的組合,愈能夠展現影像的細節與層次 顯示正在運作的影像 螢幕尺寸 解析度 影像顯示卡 愈多「像素」的顯示器與影像顯示卡的組合,愈能夠展現影像的細節與層次
影像輸出 列印 輸出影像的解析度 印表機 dpi(dot per inch) 一般而言,輸出的的影像品質比原輸入的差 熱轉印式 噴墨式 雷射式 輸出影像的解析度 dpi(dot per inch) 一般而言,輸出的的影像品質比原輸入的差 尺寸放大也會影響影像的輸出品質
影像輸出 種類 設備價格 特性 CRT螢幕 15~19吋 LCD液晶螢幕 17吋~24吋 (或更大) 投影機 依投影幕尺寸決定 體積大、重量重 價格較低 以映像管顯示影像,色彩較為準確 比較耗電 LCD液晶螢幕 17吋~24吋 (或更大) 體積小,比CRT輕 價格較傳統CRT螢幕高 螢幕顏色會因為看的角度不同而產生變化 比較不耗電 投影機 依投影幕尺寸決定 體積小、重量輕 價格高、投影尺寸大 可以當做家庭劇院設備 經由燈泡投影,無法像CRT或是LCD那麼亮 燈泡壽命有限,燈泡耗材價格高
影像處理 數位影像的好處 儲存、輸出容易 可利用軟體進行處理 常見的影像處理軟體 Photoshop PhotoImpact ACDSee
影像處理 軟體名稱 公司 軟體特性 Photoshop Adobe 功能強大的專業影像編輯軟體 支援多種影像格式 圖層的功能,適合影像編輯 提供濾鏡效果,適合影像合成
影像處理 軟體名稱 公司 軟體特性 PhotoImpact 原為友立資訊 現為科立爾 數位科技公司(Corel) 色彩管理影像網頁上傳、幻燈片製作等功能 創意範本供使用者採用 提供不同套版,可自行合成影像 操作簡單,適合一般使用者使用
影像處理 軟體名稱 公司 軟體特性 ACDSee ACD Systems 最受歡迎的看圖軟體之一 影像檔案讀取快速 介面簡單人性化 價格較低
影像傳遞 將影像傳輸到他處設備 網路頻寬與檔案大小影響傳輸時間 傳輸與網頁應用最常見的影像格式 高壓縮率的JPG檔
影像處理 數位影像的好處 藉由影像編修軟體的協助,可編修細至一個影像像素的資訊 基本的影像處理 實習課程將引導同學具備基本的影像編修技術 提供使用者自行編修的功能 藉由影像編修軟體的協助,可編修細至一個影像像素的資訊 基本的影像處理 影像選取 去除背景 色彩修正 銳利度修正 人像編修 實習課程將引導同學具備基本的影像編修技術
7.3視訊的原理
7.3.1視覺暫留的原理
視覺暫留的原理 人為什麼可以將一張張的影像看成會動的影片? 視覺暫留效應 光對視網膜所產生的視覺效應 視覺暫留效應在光停止後,會保留約二十四分之一秒 一秒鐘影像變換次數達24張以上,人眼就會視為連續的動態影片
視覺暫留的原理 視訊(Video) 通常視訊所呈現出來的結果就是影片 一系列的靜態影像賦予聲音 加以儲存、傳送與重現的各種技術 是連續的影像加上聲音效果
7.3.2 類比視訊規格
類比視訊規格 視訊格式 傳統電視系統是最具代表性的類比視訊系統 電視將視訊畫面訊號轉為電子訊號,以很快的速度連續顯示在螢幕上 分為類比與數位兩種 傳統電視系統是最具代表性的類比視訊系統 電視將視訊畫面訊號轉為電子訊號,以很快的速度連續顯示在螢幕上 為了讓人眼感覺自然,每秒所顯示的畫面個數必須夠多(必須高於視覺暫留的需求)
電視原理 映像管的電子束撞擊螢幕產生色彩 掃瞄 電子束一次只能撞擊一個點 電子束須以極高的速度移動 在很短的時間內將螢幕上的每一個點都撞擊過一遍 資料來源: http://www.khjh.kh.edu.tw/1223/b1.htm
電視原理 電子束以水平方向掃描進行 螢幕畫面由一條條水平掃瞄線構成 兩種掃瞄做法 逐條掃描 交錯式掃瞄 適用於掃描速度較高的設備 水平掃瞄線分為奇數與偶數兩組 依序先掃描所有奇數線,再掃描所有偶數線 其作用在使畫面看起來更為平順 此方法適用掃描速度不高的設備 資料來源:http://www.synnex.com.tw
電視原理 決定視訊品質好壞的因素 掃瞄線 播放畫面數目 一個畫面的掃瞄線愈多,所顯現的影像就愈清晰細緻 一秒鐘所播放畫面數目則決定所播放出來的效果是否平順。
類比視訊規格 目前世界上常見的類比視訊規格有以下三種 NTSC SECAM PAL
NTSC NTSC 1952年由美國國家電視標準委員會(National Television System Committee,縮寫為NTSC)制定的彩色電視廣播標準 NTSC標準規格 水平掃描線525條 交錯式掃描 每秒30個畫面 採用國家:美國、加拿大、墨西哥等大部分美洲國家以及台灣、日本、韓國、菲律賓
SECAM 1966年由法國研發 SECAM的特點 SECAM標準規格 不怕干擾,彩色效果好,但兼容性差 SECAM標準規格 水平掃描線625條 交錯式掃描 每秒25個畫面 採用SECAM制的國家主要為俄羅斯、法國、埃及以及非洲的一些法語系國家等
PAL 1950年代由西德的德律風根公司設計 針對美規NTSC的缺點,研究及改進 PAL標準規格 水平掃描線625條 交錯式掃描 每秒25個畫面 除了北美、東亞部分地區使用NTSC標準,中東、法國及東歐採用SECAM標準外,世界上大部份地區都是採用PAL標準
NTSC與PAL的檢驗畫面 NTSC PAL
檢驗畫面 背景白線條方格 底部畫面有1317個方格、1418條垂直及水平白線 每個方格都是正方形 檢查4:3的失真度 螢幕的聚焦功能 線直不直 螢幕的聚焦功能 線清不清楚 聚光效果 線白不白 色彩純度 灰色是否含其他色彩
檢驗畫面 電子圓圖案 電子圓是一個正圓形 直徑為12個方格 圓心是測試圖的中心 寬高比是否正確 交錯式掃描品質如何 檢查螢幕的幾何失真 圓是否很圓 交錯式掃描品質如何 圓周是否平滑,圓周如呈現鋸齒狀,表示分別掃描奇偶線的品質不佳
檢驗畫面 電子圓內部 中間偏下柵狀圖案 五組粗細不同的黑白垂直柵狀線條組成 檢查影像的清晰度 顯示的分隔條紋越細,電視機的清晰度越高
檢驗畫面 下半中央的灰度階梯 0%、20%、40%、60%、80%、100%等六種不同明亮程度的灰色組成, 檢查信號傳輸通道線性 相等間隔的灰色區塊並具有相等對比度變化,表示傳輸效果優良
三大系統的使用國家分布圖 資料來源:Wikipedia
7.3.3視訊的數位化與壓縮概念
視訊數位化與壓縮概念 未經壓縮的影片檔案有多大? 假設一個大小為352×240的影片,以每秒30張來計算,一分鐘未經壓縮的影片容量為 60(秒)×30(張)×352×240×3(RGB三色)435MB 上述是MPEG-1(也就是VCD)的規格 未經壓縮的影片一分鐘要0.4G 一小時就需要60×0.424G 目前一張VCD的容量約為680MB左右 可知數位影片的壓縮率有多大
決定壓縮率的因素 數位視訊是由很多畫格(frame)所組成,其檔案大小由下列幾個因素決定: 畫格尺寸 影像深度 畫格播放率 視訊內容 畫面的長和寬的像素 影像深度 常見的樣式是全彩,也就是RGB各8位元,總共24位元表示一個像素點 畫格播放率 每秒鐘要播放多少個畫格 視訊內容 每個畫格的內容 內容簡單的畫格通常會比內容複雜的畫格來得容易壓縮 資料來源:Winzip
高壓縮率的概念 要如何達到如此高的壓縮率? 利用連續畫格的相似性來降低儲存資料量 不需要將每個畫格都記錄 從畫格序列中挑出一些關鍵畫格(稱為I-Frame) 利用影像壓縮的方式加以儲存 介於關鍵畫格之間的其他畫格 只需儲存與關鍵畫格影像之間的差異資訊
影片壓縮 一段影片依照影片的變化程度分成許多影像群組(Group of pictures) 影像群組 一個影像群組的畫格包括 畫格間變化小的影片之影像組合 一個影像群組的畫格包括 I-Frame(Intra Frame) P-Frame(Predicted Frame) B-Frame(Bidirectional Frame) 分別給予不同的壓縮方式
影片壓縮 I-Frame P-Frame B-Frame 整個畫格採影像壓縮技術壓縮 本身不會再被其他畫格所參考
影片壓縮 一個影像群組(GOP) 前後各一個I-Frame(I)組成 之間穿插幾個P-Frame(P) I-Frame和P-Frame或P-Frame和P-Frame之間 數個B-Frame(B)所組成
影片壓縮 參考方式(以連結線表示) 第四個畫格的P-Frame 第七個畫格的P-Frame B-Frame 參考第一個I-Frame 以鄰近的I-Frame或P-Frame為參考對象 第二個畫格的B-Frame 參考第一個I-Frame及第四個P-Frame 第三畫格的B-Frame 也是參考第一個I-Frame及第四個P-Frame。
影片壓縮 一個畫格如果解碼上有雜訊 第一個畫格I-Frame有雜訊 將影響到被參考到的畫格 首先影響第四畫格的P-Frame 第四畫格又影響第七畫格 第二、三畫格被第一及第四畫格所影響 第五、六畫格也被第四及第七畫格所影響
影片壓縮 觀看影片的現象 某一個畫面有雜訊出現 影片觀看時,無法以跳躍至任何一個畫格 有時會影響影片一段時間(I或P frame) 有時卻又一閃即逝(B-Frame) 影片觀看時,無法以跳躍至任何一個畫格 大部分的軟體只有I-Frame接受跳躍觀看
7.3.4 數位視訊規格
數位視訊規格 MPEG-1、MPEG-2或MPEG-4有甚麼差別 MPEG影音壓縮技術 由ISO組織的Motion Picture Expert Group委員會 1988年起提出,因此簡稱為MPEG 根據其不同用途,先後提出了MPEG-1、MPEG-2、MPEG-4、MPEG-7等規格 資料來源:维基百科
MPEG-1 最早發表的MPEG規格 採用區塊方式的運動補償 離散餘弦轉換(DCT) 量化等技術 規格要求 1.2Mbps的傳輸速率 標準解析度為352×240 色彩運算採用較符合人類感官知覺的YCbCr色彩模型 YCbCr是RGB外的一種色彩模型 MPEG-1對於單一影像採用類似於JPEG的壓縮技術 資料來源:维基百科
MPEG-1 VCD 採用MPEG-1作為核心技術 解析度為352×240 使用固定1.15Mbps的位元率,略低於MPEG-1的需求 在播放快速動作的視訊時 由於資料量的不足,使視訊畫面容易出現模糊的方塊 VCD很快被隨後的DVD取代
MPEG-1 MPEG-1存在的時間不長 最重要的是它對聲音訊號的壓縮技術 第三代協定被稱為MPEG-1 Layer 3 MP1 MP2 應用在LD作為記錄數位聲音上 MP2 應用於歐洲版的DVD聲音壓縮技術之一
MPEG-2 MPEG-2的改進 MPEG-2經過少量修改後,成為DVD產品的核心技術 標準解析度擴增成720×480 資料來源:http://product.pcpop.com
MPEG-4 用於視訊與音訊的壓縮編碼標準 目的 將視訊資料壓縮到極低的位元比率 提供使用者與視訊內容間的互動編輯能力 將視訊當中各種不同的資料以「物件」加以表示
MPEG-4 對比於MPEG-2的區塊分析比對技術 儘管影像變化速度很快,當顯示速率不足時,也不會出現區塊效應 記錄影像物件變化 儘管影像變化速度很快,當顯示速率不足時,也不會出現區塊效應 資料來源:http://mpeg.chiariglione.org/standards/mpeg-4/mpeg-4.htm
MPEG-4 使用者可藉由「物件」的重組達到視訊編輯的效果 MPEG-4主要用途在網上串流、光碟、語音傳送(視訊電話)及電視廣播 所以各個公司都可以根據MPEG-4的標準開發不同的規格,例如WMV 9、Quick Time、DivX、Xvid等
MP4與MPEG4 MP4 音頻、視訊的規範 目前有兩種概念 特別強調著作權功能 MP3的改良版 支援視訊的撥放規格
MP5與MPEG的關係 MP5 廠商發明的名稱 可撥放RM、RMVB等 MP5和MPEG無關 不是ISO/IEC標準
MPEG-7 MPEG-7規格的目標 MPEG-7與之前MPEG-1,2,4的最大區別 建立對多媒體內容的描述標準 滿足視訊、影像、語音的多媒體應用要求 MPEG-7與之前MPEG-1,2,4的最大區別 MPEG-1,2,4重點是高效率的視訊壓縮編碼法 MPEG-7目的是更有效地描述多媒體資料的特徵 MPEG-7視頻描述包括基本的結構和顏色及紋理等幾種明顯的視覺描述 有助於將來對多媒體資料的管理
AVI AVI(Audio Video Interleave) 副檔名為.avi 微軟公司所開發的一種視訊與音訊規格 Windows作業平台上最廣泛的視訊與音訊規格
Quick Time 副檔名為.mov 蘋果電腦所推出的一種多媒體規格 能處理視訊、音效、文字、動畫及音樂格式等類型資料 任何人都可以使用,無須支付權利金
VCD Video Compact Disc VCD是常見的光碟影片格式之一 使用MPEG-1壓縮技術 影片品質約為VHS錄影帶的影片等級
SVCD Super Video CD VCD的加強版本 採用MPEG-2視訊壓縮技術 常見的SVCD可儲存、播放約30-45分鐘的影片
DVD Digital Video Disc 採用MPEG-2壓縮標準 解析度為720×480 聲音可採PCM、杜比AC3或DTS等格式 目前影片製作的主要播放格式
Blu-ray Disc BD(Blu-ray Disc,藍光光碟) 自2006年起由SONY推動相關藍光產品 命名由來因其採用波長405奈米的藍色雷射光束來進行讀寫操作 一個單層藍光光碟的容量為25GB,能錄製一個長達4小時的高解析視訊 雙層的藍光光碟容量為50GB CH01 電腦基本架構
ITU International Telecommunication Union 另建議視訊標準H.26x系列
HDTV High Definition Television HDTV高畫質電視 ITU給高畫質電視下的定義 一種新型的電視系統 ITU給高畫質電視下的定義 高畫質電視應是一個透明系統,一個正常視力的觀眾處在距該系統顯示螢幕高度的三倍距離上所看到的影像品質,應該得到有如觀看原始景物或表演時所得到的印象 水平和垂直解析度是一般電視的兩倍左右,並且配有環繞聲響
HDTV 透過數位信號傳送 早期的歐洲和日本的高畫質電視採類比訊號傳送 一般的高畫質電視支援1920×1080 每秒24個畫格
解析度比較 資料來源:Wikipedia