Computer Science An Overview 10th edition by J. Glenn Brookshear Chapter 1: 資料儲存(Data Storage)
overview: 總的看法,一般看法;略讀,瀏覽 edition: 版,版本,版次
Chapter 1:資料儲存(Data Storage) 1.1 位元及其儲存 (Bits and their Storage) 1.2 主記憶體 (Main Memory) 1.3 大量儲存設備 (Mass Storage) 1.4 資訊的位元表示法 (Representing Information as Bit Patterns) 1.5 二進位系統 (The Binary System) Chapter 1:資料儲存(Data Storage)
pattern: 圖案,模範,榜樣,型,式樣,樣品, 圖樣( noun )。摹制,仿造,以圖 案裝飾 mass: 塊,大多數,質量,大量,群眾,彌撒(a.)群眾 的,大規模的,集中的(vt.)使集合 storage: 存儲器,儲藏,保管,庫存,倉庫 represent: ( vt )表現,表示,描繪,講述, 聲稱,代表,象徵,扮演,回憶, 再贈送
Chapter 1: Data Storage(continued) 1.6 儲存整數 (Storing Integers) 1.7 儲存分數 (Storing Fractions) 1.8 資料壓縮 (Data Compression) 1.9 通訊失誤 (Communications Errors) Chapter 1: Data Storage(continued)
store: ( 名詞 )商店,貯藏,倉庫,備用品, 存儲器 (動詞)儲存,貯藏, 供給貯藏。 (形容詞) 貯藏的 fraction:碎片,少量,一小部分 , 分數 compression: 壓縮,壓榨,縮小壓縮 communication:通訊; 通信 error: 錯誤
1.1位元及其儲存(Bits and their Storage) 現今電腦的內部,資訊被編碼成一連串的 0 與 1 的圖樣。這些數字被稱為位元(binary digit, bit)。 布林運算 位元 0 代表偽,而位元 1 代表真。 這種處理真/偽的運算稱為布林運算(Boolean operation),如Figure 1.1。
Figure 1.1 The Boolean operations AND, OR, and XOR (exclusive or) 1-8
1.1位元及其儲存(Bits and their Storage) P AND Q 其中 P 是一個陳述,Q 是另一個陳述──例如, Kermit 是一隻青蛙 AND 豬小姐是位女演員 1 AND 1 才會是 1,其他情況都會產生 0 輸出 OR 的運算是基於以下形式的複合陳述 P OR Q 兩者之中至少一個陳述是真時,則此陳述就是真的。 XOR 運算是在兩個輸入中的一個為 1(真)而另一個是 0 (偽)時才會產生 1(真)。
1.1 位元和位元模式 (Bits and Bit Patterns) Bit: Binary Digit (0 or 1) Bit Patterns are used to represent information. numbers text characters images sound and others 1.1 位元和位元模式 (Bits and Bit Patterns)
manipulate: 操縱,利用,操作,應付,假造 digit: 數字,位數,指頭 text: 正文,本文;原文;主題文句,主要經文 character: 字元 image: 圖像,形象,翻版( 名詞 )。 作...的像,反映,想像,象徵圖像, 影像,肖像,想像
布林運算 (Boolean Operations) Boolean Operation: An operation that manipulates one or more true/false values Specific operations AND OR XOR (exclusive or) NOT 布林運算 (Boolean Operations)
閘(Gate) 當給定運算的輸入時,能夠產生布林運算輸出的基本元件稱為閘(gate),如Figure 1.2。
Figure 1.2 AND、OR、XOR 及 NOT 閘的圖示及其輸入值與輸出值(A pictorial representation of AND, OR, XOR, and NOT gates as well as their input and output values) 1-14
閘 (Gates) Gate: A device that computes a Boolean operation Often implemented as (small) electronic circuits Provide the building blocks from which computers are constructed VLSI (Very Large Scale Integration) 1-15
device:裝置; 設備 compute:計算 implement:實施建置 electronic:電子的 circuit:電路; 線路 scale:標度; 尺度 block:塊;資塊,磁區,資料段,段落;區段;區塊 construct:構造,建造,想出,作圖構成物 integration:整合, 集中
正反器(flip-flop) Figure 1.3 稱為正反器(flip-flop)的電路。一個正反器就是會產生 0 或 1 的輸出值的電路,而這個輸出值會持續到其他線路短暫地改變其電壓時,才會迫使這個輸出值改變。
Figure 1.3 A simple flip-flop circuit 1-18
Flip-flop: A circuit built from gates that can store one bit. One input line is used to set its stored value to 1 One input line is used to set its stored value to 0 While both input lines are 0, the most recently stored value is preserved 正反器(Flip-flops)
Figure 1.4 Setting the output of a flip-flop to 1
Figure 1.4 Setting the output of a flip-flop to 1 (continued)
Figure 1.4 Setting the output of a flip-flop to 1 (continued)
十六進制表示法(Hexadecimal Notation) Hexadecimal notation: A shorthand notation for long bit patterns Divides a pattern into groups of four bits each Represents each group by a single symbol Example: 10100011 becomes A3 十六進制表示法(Hexadecimal Notation)
hexadecimal notation:十六進制表示法 shorthand:速記,簡寫 divide: (vt.)除;分配,分享;分歧(vi.)分,分開;分裂, 意見分歧;除,分,劃分;分開,隔開 group: 組 symbol:符號,象徵,代號,信條
Figure 1.6 The hexadecimal coding system
1.2 主記憶體(Main Memory) 在電腦內有一大群存放單一位元的電路, 稱為機器的主記憶體(main memory)。 一般記憶單元的大小是 8 位元。 位元組(byte)這個詞來表示 8 位元 的記憶單元。 1-26 26
Main Memory 一般將在記憶單元內的各個位元視為排列成一列。 左端為高階端(high-order end),右端為低階 端(low-order end),如圖 1.7 所示。 主記憶體的各個記憶單元都被指定一個唯一的 「名字」,稱為其位址(address)(Figure 1.8 )。
Figure 1.7 The organization of a byte-size memory cell 1-28
significant: (a.)重要的,有含義的,暗示的, 有效的,非偶然的 least: 最少 most: 最多
Figure 1.8記憶單元按位址排列 ( Memory cells arranged by address) 1-30
1.2 主記憶體記憶單元(Main Memory Cells) Cell: A unit of main memory (typically 8 bits which is one byte) 最高有效位元(Most significant bit): the bit at the left (high-order) end of the conceptual row of bits in a memory cell 最低有效位元( Least significant bit): the bit at the right (low-order) end of the conceptual row of bits in a memory cell
unit:單位;單元,部件,裝置,設備;器 typically:典型地 significant: (a.)重要的,有含義的,暗示的,有效的, 非偶然的 cell:單元; 胞狀; 資料格; 字元格 conceptual:概念 row:行 column: 列
Main Memory Addresses Address:主記憶體的各個記憶單元都被指定一個 唯一的「名字」,稱為其位址(address) (Figure 1.8 )。 A “name” that uniquely identifies one cell in the computer’s main memory The names are actually numbers. These numbers are assigned consecutively starting at zero. Numbering the cells in this manner associates an order with the memory cells. 1-33
unique: (a.)獨一無二的,獨特的,稀罕的 identify: 識別,認明,鑑定,使等同 於,一致,變成一致 consecutively:連續地 manner:方式 associate:使發生聯系,使聯合; 把…聯想 起來(vi.)交往,結交合夥人, 同事(a.)副的
Main Memory 主記憶體通常稱為隨機存取記 憶體(random access memory, RAM)可以依任何順 序取用記憶單元,每個記憶單元 都可以隨需要獨立地被存取。
random:隨機 dynamic:動態 access: 存取
Measure Main Memory Capacity 早期電腦的記憶體大小常以 1024 (也 就是 210)個記憶單元為單位來度量。 因為 1024 接近 1000,所以在電腦界採 用 kilo(千)這個英文字首表示這個度 量單位。
Measure Main Memory Capacity kilobyte(縮寫為 KB),用來表示 1024 位元組, 4096 記憶單元,具有 4KB(4096 = 4×1024) 記憶體。 mega 1,048,576(也就是 220 ),giga 表示 1,073,741,824(也就是 230 ),MB(megabyte) 及 GB(gigabyte)。
Random Access Memory (RAM): Memory in which individual cells can be easily accessed in any order Dynamic Memory (DRAM): RAM composed of volatile memory Memory Terminology
Individual: 個別的 compose: 組成,寫作,作曲,使平靜創作,排字,編寫 volatile: /v'ɑlətəl/揮發
Measuring Memory Capacity Kilobyte: 210 bytes = 1024 bytes Example: 3 KB = 3 times1024 bytes Sometimes “kibi” rather than “kilo” Megabyte: 220 bytes = 1,048,576 bytes Example: 3 MB = 3 times 1,048,576 bytes Sometimes “megi” rather than “mega” Gigabyte: 230 bytes = 1,073,741,824 bytes Example: 3 GB = 3 times 1,073,741,824 bytes Sometimes “gigi” rather than “giga” Measuring Memory Capacity
Mass Storage On-line versus off-line Typically larger than main memory Typically less volatile than main memory Typically slower than main memory Mass Storage
versus:比對 on-line:連線線上 of-line:脫機,離線
1.3 大量儲存設備(Mass Storage Systems) Magnetic Systems Disk Tape Optical Systems CD DVD Flash Drives
magnetic: (a.)有磁性的,有吸引力的,催眠術的 optical: 視覺的,眼睛的,光學的 flash: 閃光,閃現,一瞬間,閃光,閃現, 反射。使閃光,反射
Hard Disk 讀寫頭會在磁碟的上表面或下表面走過一個圓形軌跡,稱為磁軌(track)。 所有讀寫頭一同移動時,所能讀取的各碟片上的磁軌便形成如圓柱體,稱為磁柱(cylinder)。 磁軌又被分割成許多圓弧,稱為磁區(sector)。
Figure 1.9 A magnetic disk storage system 1-47
Figure1.9.1: 移動磁頭磁碟機
Hard Disk 一般的容量是在 512 位元組到數個 KB 之間。 磁軌、磁區的位置並非磁碟實體結構的永久部份。 相反地,它們是磁碟經過格式化(formatting)[ 或初始化(initializing)]的過程而標示出來的。
Hard Disk 高容量的磁碟系統可以有數 GB 的容量,一般是由五到十片硬式的磁片串在一個共用的軸上。 使用硬式的碟片,被稱為硬碟機(hard-disk system)。
Hard Disk 幾個量測參數評估磁碟系統的效能: (1)尋覓時間(seek time):把讀寫頭從一個磁軌移動至另一磁軌所需時間; (2)轉動延遲(rotation delay),或叫潛行時間(latency time),當磁頭已經置於存放資料的磁軌時,把資料所在位置轉動至讀寫頭的平均時間; (3)存取時間(access time):尋覓時間與轉動延遲 (4)傳輸速率(transfer rate):把資料從磁碟系統移出或移入的速率。 Hard Disk
Figure 1.10 Magnetic tape storage
Figure 1.11 CD storage
outer: 外面的,外部的,外層的 spiral: 螺旋形之物(a.)螺旋形的,盤旋的 (vi.)成螺旋狀下降,成螺旋狀上升 edge: 邊, 邊緣
File: A unit of data stored in mass storage system Fields(欄位) and keyfields(關鍵欄; 主要欄位 ) Physical record versus Logical record Buffer(緩衝器 ): A memory area used for the temporary storage of data (usually as a step in transferring the data) Files
transfer: 遷移,移動,傳遞,轉讓,轉移,過戶,匯兌, 換車(vt.)轉移,調轉,調任,改變,傳遞
檔案的儲存及取用 在大量儲存設備上,資訊是以檔案(file)為單位儲存。一個典型的檔案可以是一個完全是文字的文件、一張照片、一個程式,或是某個公司的員工資料。 符合儲存系統的實體特性而分成的資料區塊稱為實體紀錄(physical record)。檔案一般都由數個實體紀錄所組成。
檔案的儲存及取用 一個檔案也可依其所代表的資訊來自然分割,如一個文件檔由數個段落或頁面組成,這種自然生成的資料區塊稱為邏輯紀錄(logical record)。 邏輯紀錄經常由數個更小,稱為欄位(field)的單位組成。 用來指認的欄位稱為鍵欄位(key field),而鍵欄位的值稱為鍵值(key)。
Figure 1.12 Logical records versus physical records on a disk
一般文字形態的資訊都是以編碼(code)的方式來呈現。 文字的表示方法 一般文字形態的資訊都是以編碼(code)的方式來呈現。 美國資訊交換標準碼(American Standard Code for Information Interchange, ASCII) 1.4 資訊的位元表示法
Figure 1.13 The message “Hello.” in ASCII 1-61
文字的表示方法 用長度為 7 的位元圖樣來表示大、小寫的英文字母、標點符號、數字(0~9)及一些控制列印的資訊,如換行(line feed)、歸位(carriage return)及跳格(tab)等。 現在 ASCII 常將原來的七個位元外加一個 0 的位元在最高有效位元而延長到以 8 個位元來表示一個符號。 1.4 資訊的位元表示法
通用碼(Unicode),也稱為萬國碼或國際通用碼)。 是用唯一的 16 位元圖樣來表示每一個符號。 由 65,536 個不同的位元圖樣所組成,足夠表示在如中文、日文及希伯來文中可寫的文字。
Representing Text Each character (letter, punctuation, etc.) is assigned a unique bit pattern. ASCII: Uses patterns of 7-bits to represent most symbols used in written English text Unicode: Uses patterns of 16-bits to represent the major symbols used in languages world side ISO standard: Uses patterns of 32-bits to represent most symbols used in languages world wide 1-64
character:字元,字; 性格,品質; 特性,特徵; 人物,角色; pattern: 圖案,模範,榜樣;型,式樣;樣品;圖樣(vt.) 摹制,仿造;以圖案裝飾 symbol:符號,象徵,代號,信條 text: 正文,本文;原文;主題文句,主要經文
數值的表示方法 二進位表示法(binary notation),可以在此 16 位元中存入從 0 到 65535 之間的任意正整數。 二進位表示法是一種只用數字 0 及 1 來表示數值的方法。 0000 0001 0010 0011 0100 0101 0110 0111 1000 這個數列含有整數 0 到 8 的二進位表示法。
Representing Numeric Values Binary notation: Uses bits to represent a number in base two Limitations of computer representations of numeric values Overflow – occurs when a value is too big to be represented Truncation – occurs when a value cannot be represented accurately Representing Numeric Values
limitation: 限制;限度,局限,限制因素 overflow: 溢值,超值,泛濫(vt.)(vi.)(使)泛濫,(使) 溢出,(使)充溢 truncation: 切掉頂端,截頭,截斷 occur: (vi.)發生,想到,存在 accurate: (a.)准確的;精確的
圖像的表示方法 把圖像看成是由一群圖點所組成,每個圖點稱為一個像素(pixel),是英文 “picture element” 的簡寫。 將每一個像素編碼,而整個圖像就可以由一群編碼後的像素集合而成。這樣的集合被稱為位元圖(bit map,又稱點陣圖)。 單純的黑白圖像,每個像素可以由一個位元來代表。 每個像素可以用一群位元(通常 8 個)來表示,而讓不同層次的灰階。
picture: 圖片,照片,影片(v.)繪畫,拍攝,描寫,想象,圖 畫 element: 元素; 單位 bit map: 位元圖,點陣圖
彩色圖像常用的方式有兩種。 第一種我們稱為 RGB 編碼(RGB encoding)。一般會用另一個位元組來表示各色彩元素的強度。一個像素需要三個位元組的儲存空間。 另一種方式是使用一個「亮度」元素及兩個顏色元素。 另外兩個元素稱為藍色度(blue chrominance)及紅色度(red chrominance)。
chrominance: /kr'omənəns/ 色度 pixel: 點;點;像素,圖素,圖元;像素,象元 luminance: 光度, 亮度 vector: 向量,向量,帶菌者(vt.)無線電導引 True Type: PostScript:
TrueType 是由 美國 蘋果公司 和 微軟 公司共同 開發的一種 電腦 輪廓 字體 類型標準。 這種類型 字體文件的 擴展名 是 TrueType 是由 美國 蘋果公司 和 微軟 公司共同 開發的一種 電腦 輪廓 字體 類型標準。 這種類型 字體文件的 擴展名 是 .ttf ,類型代碼是 tfil 。 早在 80年代 末,蘋果公司為了對抗 Adobe 公司 的 Type 1 PostScript 字體,設計開發了TrueType ,之後 微軟 加入了開發,後來 視窗 系統的字體 格式基本上都統一成TrueType,而在蘋果的 麥金 塔 系統中卻成了PostScript和TrueType對立的局 面。 TrueType後來也被 Linux 等系統使用,成為 標準字體。 TrueType的主要強項在於它能給開發 者提供關於字體顯示、不同字體大小的像素級顯 示等的高級控制。
一個 postcript ,簡稱 P.S. ,是寫作主體後添加 一個字母(或其他身體寫作)。 這個詞來自 拉丁 語 郵政 scriptum ,表達式的意義“後寫的” 一個 postscript 可能是一個句子,一個段落,或 偶爾的許多段落補充,往往匆匆順便後簽署的信 件或(有時)為主體的一篇文章或書。 在書或文 章,更精心組成的加法(例如,第二版)被稱為 一個 後記 。 一個後記,而不是通常被稱為一個 後記,寫在回應批評意見的第一個版本。 這個“ 後記”有,詩意,被用來指任何形式的增編一些 主要工作,即使沒有連接到一個主要工作,如 瑟 倫克爾凱郭爾 的著作名為 後記不科學的結論 (Unscientific postscript)。
Representing Images Bit map techniques Pixel: short for “picture element” RGB Luminance and chrominance Vector techniques Scalable TrueType and PostScript Representing Images
聲音的表示方法 聲音資訊編碼最通用方法是以固定的間隔來對音波的大小抽樣並記錄所得到一連串的數值。 例如 0、1.5、2.0、1.5、2.0、3.0、4.0、3.0、0 這一串數字代表一個起伏的聲波,(如圖 1.14 所示)。 每秒 8000 個樣本的抽樣率在長途語音電話通訊方面使用多年。 音樂 CD 抽樣次數是每秒 44,100 次。
Figure 1.14以 0、1.5、2.0、3.0、4.0、0 數列表示的聲波(The sound wave represented by the sequence 0, 1.5, 2.0, 1.5, 2.0, 3.0, 4.0, 3.0, 0) 1-77
Representing Sound Sampling techniques Used for high quality recordings Records actual audio MIDI Used in music synthesizers Records “musical score” Representing Sound
sampling:取樣,抽樣 record technique: 技巧,技術,技術,方法 quality:品質,特質,才能,質量(a.)優質的品質 audio:成音頻率的,聲音的 MIDI synthesizer: /s'ɪnθəs,ɑɪzɚ/合成器 score:得分,分數;二十, 點,方面,理由,根 據, 獲得,得,記...的分數
樂器數位介面(Musical Instrument Digital Interface,簡稱 MIDI)是一個工業標準的電子 通訊協定,為電子樂器等演奏裝置(如合成器) 定義各種音符或彈奏碼,容許電子樂器、電腦或 其它的演奏配備彼此連接,調節和同步,得即時 交換演奏資料。 MIDI 不傳送聲音,只傳送像是音調和音樂強度的 數位數據, 音量,抖音和 方位[1] 等參數的控制 訊號,還有設定節奏的時鐘信號。在不同的電腦 上,輸出的聲音也有所不同(亞德諾半導體公司 編解碼器的使用者和創新科技音效卡的使用者最 為明顯)。
MIDI 播映控制協議(MSC Protocol)是為 MIDI 而設的工業標準,由 MIDI 設備生產商協 會 在 1991 年制定。它允許不同種類的媒體控制 裝置在相互之間的通訊,藉助電腦可以表現現場 顯示控制的功能與娛樂應用。與音樂 MIDI 相同 ,MSC 並不傳輸實際顯示的媒體 - 它只是簡單 地傳輸有關多媒體性能的數位訊號。
1.5 二進位系統 二進位表示法是一種只用數字 0 和 1 來表示數值的方法。 二進位表示法 若要計算二進制數的值,我們可以依十進制數的計算程序來處理。 1.5 二進位系統
二進位系統(The Binary System) The traditional decimal system is based on powers of ten. The Binary system is based on powers of two. 二進位系統(The Binary System)
traditional:傳說,傳統,慣例,引渡,交付 binary:二進位的,二元的 decimal:十進制,小數點, 十進位的,小數的
Figure 1.15 The base ten and binary systems
Figure 1.16 Decoding the binary representation 100101
Figure 1.17 將正整數轉換成二進制數的演算法
Figure 1.17將正整數轉換成二進制數的演算法(An algorithm for finding the binary representation of a positive integer)
algorithm: 演算法 remainder: 剩餘物,其他的人,殘餘,餘數,廉 價出售,剩餘的,出售剩書的 quotient: 商,份額,應得部分 obtain: 獲得,達到,流行 original:原始的;正本;原文,原(文)件;初始的 consist: 由...組成,由...構成,存在於,在於 list:目錄,名單,明細表,布條,條紋(vt.)列出,列於 表上,記入名單內,裝布條
Figure 1. 18 Applying the algorithm in Figure 1 Figure 1.18 Applying the algorithm in Figure 1.15 to obtain the binary representation of thirteen
二進位加法
Figure 1.19二進位加法原則(The binary addition facts)
二進位中的分數 二進位數 101.101 被解碼成 5 ,如圖 1.20。 10.011 加 100.11 等於 111.001 ,如下所示:
Figure 1.20 Decoding the binary representation 101.101 1-94
Figure 1.20 將二進位數 101.101 解碼
1.6 儲存整數(Storing Integer) 2的補數表示法 two’s complement notation。 在 2 的補數系統中,最左邊的(最高位數)位元代表數值的正負符號。因此這個最左的位元也被稱為符號位元(sign bit)。 負整數符號位元一定是 1,而正整數的符號位元為 0。 2 的補數之加法。圖 1.23 中三個加法問題。 溢位問題:溢位(overflow),亦即當所要表示的數值超出可以表示的數值範圍時會發生的問題。
Figure 1.21 Two’s complement notation systems
Figure 1.22 Coding the value -6 in two’s complement notation using four bits 1-98
Figure 1.22 用 4 位元之 2 的補數將數值-6編碼
Figure 1.23 Addition problems converted to two’s complement notation 1-100
Figure 1.23 加法問題轉換成 2 的補數表示法
超額表示法 excess notation。 Figure 1.24 所示的系統是超額 8 表示法(excess eight notation)。
Figure 1.24 An excess eight conversion table 1-103
Figure 1.25 An excess notation system using bit patterns of length three
Storing Integers Two’s complement notation: The most popular means of representing integer values Excess notation: Another means of representing integer values Both can suffer from overflow errors. 1-105
complement: 補足物,補語,餘角(vt.)補助,補足 mean:意思是,意味著,有重大意義;預定,打算,准 備,意欲(a.)中間的,中庸的,平均的
浮點表示法 先設定此位元組高階端的位元為符號位元。符號位元為 0 則表示該數非負值,符號位元為 1 則表示該數為負值。 將剩下的 7 個位元分成 2 組,為指數欄(exponent field)及假數欄(mantissa field),如Figure 1.26。 01101011,符號位元為 0,指數是 110,假數是 1011。 位元組 01101011 就表示 2 。 捨棄誤差 Figure 1.27。 捨棄誤差(truncation error 或 round-off error),即表示因為假數欄的長度不夠,所以儲存的值有一部份因而遺失。 1.7. 儲存分數
Floating-point Notation: Consists of a sign bit, a mantissa field, and an exponent field. Related topics include Normalized form Truncation errors Storing Fractions
Figure 1.26 Floating-point notation components
Figure 1.27 Encoding the value 25⁄8
1.8 資料壓縮 資料壓縮方法有兩大類型。有些是無減損的(lossless),其他則是有減損的(lossy)。 重複次數編碼(run-length encoding)的無減損方法,是將一連串相同的資料元件以一種能指出重複的資料元件及其在串列中發生次數的代碼來取代。 1.8 資料壓縮
1.8 資料壓縮 次數相關編碼(frequency-dependent encoding)。 變動長度編碼(variable-length codes)。 用這方式產生的碼一般稱為霍夫曼碼(Huffman code)。 1.8 資料壓縮
1.8 資料壓縮 相對編碼(relative encoding)也稱為差異編碼(differential encoding)。是以記錄相連資料區塊間的差異而不是整塊資料,也就是記錄每一個區塊與前一區塊的相對關係。
壓縮圖像 GIF(Graphic Interchange Format)是由 CompuServe 公司所發展出來。 能指派給每個像素的顏色只有 256 種。 每個像素可以用單一個位元組來表示,而其值指出 256個調色盤項目中哪一個代表該像素的顏色。 GIF 是一種有減損的壓縮系統。
壓縮圖像 JPEG(唸成 “JAY-peg” ),是國際標準組織(ISO)領導的 Joint Photographic Experts Group 所發展的一套標準。 事實上包含好幾套圖像表示方法。 JPEG 的基本標準一般可將彩色圖像壓縮至少十倍,而經常可以做到三十倍卻不會明顯地犧牲其品質。
壓縮圖像 TIFF(是 Tagged Image File Format的縮寫),然而TIFF 最廣泛的應用並不是作為資料壓縮之用,而是作為儲存照片及其相關資訊如日期、時間及相機設定等的標準格式。 大多是設計來為傳真文件中的圖像壓縮之用。
壓縮聲音及影像 影像專家團體,MPEG 涵括為不同應用而設的各種標準。 最廣為人知壓縮聲音的系統是 MP3,也是由 MPEG 標準中發展而來。事實上,MP3 這個縮寫字就是 MPEG Layer 3 的縮寫。 MP3 能夠在維持近似於 CD 品質的聲音之下對聲音做相當的壓縮。
壓縮聲音及影像 利用 MPEG 及 MP3 技術,攝影機在 128 MB 的儲存空間內錄下一個鐘頭的影像,隨身音樂播放機可以在 1 GB 之內存入 400 首流行歌曲。 應用 MPEG 技術,影像能夠在一個提供 40 Mbps 傳輸率的通訊頻道上成功地被播放。MP3 錄製的聲音通常需要 64 Kbps 以內的傳輸率。
Lossy versus lossless Run-length encoding Frequency-dependent encoding (Huffman codes) Relative encoding Dictionary encoding (Includes adaptive dictionary encoding such as LZW encoding.) Data Compression
GIF: Good for cartoons JPEG: Good for photographs TIFF: Good for image archiving Compressing Images
Compressing Audio and Video MPEG High definition television broadcast Video conferencing MP3 Temporal masking Frequency masking Compressing Audio and Video
1.9通訊失誤(Communication Errors) 為了解決這個問題,許多編碼技術遂應運而生,用來偵測,甚至更正這些錯誤。 同位元(parity bit) 如果每個所處理的位元圖樣都有奇數個 1,但是卻收到偶數個 1 的位元圖樣,就表示有錯誤發生。 1.9通訊失誤(Communication Errors)
1.9 通訊失誤(Communication Errors) 需要一個位元圖樣皆含有奇數個 1 的編碼系統。 可以簡單地對編碼系統中每一個圖樣加入一個額外的位元,稱為同位元(parity bit),就可以達成,針對每個位元圖樣只要給定新加入位元為 1 或 0,就可使得到的圖樣有奇數個 1。 1.9 通訊失誤(Communication Errors)
Figure 1.28 The ASCII codes for the letters A and F adjusted for odd parity 1-124
Figure 1.28 調整成奇同位之 A、F 的 ASCII 碼 Figure 1.28 顯示出odd parity同位元如何被加入英文字母 A 及F 的 ASCII 碼中。 Figure 1.28 調整成奇同位之 A、F 的 ASCII 碼
1.9通訊失誤(Communication Errors) 錯誤更正碼(error-correcting codes),如Figure 1.29。 漢明距離(Hamming distance)為二個位元圖樣間相異的位元數目。Figure 1.29 中 A 與 B 的漢明距離為 4,而 B 與 C 的漢明距離為 3。Figure 1.29 所展示這種碼的重要特徵是任兩個圖樣之間的漢明距離至少為 3。
Figure 1.29 An error-correcting code 1-127
1.9 通訊失誤(Communication Errors) 如圖 1.30 。我們可以斷定傳送的字元為 D,因為其漢明距離最近。
Figure 1.30 Decoding the pattern 010100 using the code in Figure 1.29 1-129
Communication Errors Parity bits (even versus odd) Checkbytes Error correcting codes 1-130