第 2 章 敘述統計:表格與圖形法
本章內容 2.1 類別資料的彙總 2.2 定量資料的彙總 2.3 運用表格彙總雙變數資料 2.4 以圖形彙總雙變數資料 2.1 類別資料的彙總 2.2 定量資料的彙總 2.3 運用表格彙總雙變數資料 2.4 以圖形彙總雙變數資料 2.5 資料可視化:建立有效圖形表示的最佳作法
2.1 類別資料的彙總 次數分配 相對次數分配與百分比次數分配 長條圖與圓形圖 第2章 敘述統計:表格與圖形法 第31-34頁
敘述統計:表格與圖形法 類別資料 (categorical data) 用於項目的分類,通常 是用標記或名稱表示。 定量資料 (quantitative data) 以數值來顯示數量多 寡。 第2章 敘述統計:表格與圖形法 第30-31頁
次數分配 次數分配 (frequency distribution) 是資料的表格彙 總方式,用以顯示不相重疊的各資料類別或組別中 各自含有的觀察值次數。 次數分配彙整50 筆購買紀錄在五種產品間的分布 情形,也讓人瞭解五種產品在市場上的受歡迎程度。 第2章 敘述統計:表格與圖形法 第31-32頁
次數分配 下列例子示範類別資料次數分配的建立與解釋。 Coca-Cola、Diet Coke、Dr. Pepper、Pepsi 和Sprite 是五種廣受歡迎的軟性飲料。表 2.1 是 50 筆軟性 飲料購買紀錄構成的樣本。 第2章 敘述統計:表格與圖形法 第31頁
次數分配 第2章 敘述統計:表格與圖形法 第31頁
次數分配 為了建立這些資料的次數分配,我們算出每種飲料 出現在表 2.1 的總次數,Coca-Cola 出現 19 次, Diet Coke 出現 8 次,Dr. Pepper 出現 5 次, Pepsi 出現 13 次,Sprite 出現 5 次。 我們以次數分配彙整軟性飲料出現次數如表 2.2 所 示。 第2章 敘述統計:表格與圖形法 第31頁
次數分配 第2章 敘述統計:表格與圖形法 第32頁
相對次數分配與百分比次數分配 一個資料組的相對次數 (relative frequency) 即代表 該類別之觀察值次數與所有觀察值次數的比率。 一個組別的相對次數 = 第2章 敘述統計:表格與圖形法 第32頁
相對次數分配 相對次數分配 (relative frequency distribution) 是 資料的表格化彙總,顯示每組的相對次數。 第2章 敘述統計:表格與圖形法 第32頁
百分比次數分配 百分比次數分配 (percent frequency distribution) 也是資料集的表格化彙總,顯示每一組的百分比次 數。 第2章 敘述統計:表格與圖形法 第32頁
相對次數分配與百分比次數分配 表 2.3 是軟性飲料資料的相對次數分配和百分比次 數分配,可看出 Coca-Cola 的相對次數是 19/50 = 0.38、Diet Coke 的相對次數是 8/50 = 0.16 等。由 百分比次數分配,我們可發現 38% 的購買者選擇 Coca-Cola、16% 選擇 Diet Coke 等,也可看出前三 名占全體比例為 38% + 26% + 16% = 80%。 第2章 敘述統計:表格與圖形法 第32頁
相對次數分配與百分比次數分配 第2章 敘述統計:表格與圖形法 第32頁
長條圖 長條圖 (bar chart) 是一種圖形,描述以次數分配、 相對次數分配,或百分比次數分配進行彙總的類別 資料。 圖形的一軸 (通常是橫軸) 用來標記組別。圖形的另 一軸 (通常是縱軸) 則表示次數、相對次數或百分比 次數。 各個組別名稱上方有固定寬度的長條,長條的高度 表示次數、相對次數或百分比次數。 對類別資料而言,每個組別應有所分隔不相鄰接, 表示每個組別 (或類別) 是有所區隔的。 第2章 敘述統計:表格與圖形法 第32頁
長條圖 圖 2.1 為 50 筆軟性飲料購買資料的次數分配長條 圖。在圖形中可看出 Coca-Cola、Pepsi 與 Diet Coke 為最受歡迎的品牌。 第2章 敘述統計:表格與圖形法 第32-33頁
柏拉圖圖示法 在品質管制應用上,我們經常使用長條圖來找出引 發問題的最重要原因。 若長條圖由左至右,以遞減的方式排列, 即最左 邊為最常發生的原因, 則此種長條圖稱之為柏拉 圖圖示法(Pareto diagram) 。 此圖之命名是為了紀念發明者義大利經濟學家 Vilfredo Pareto。 第2章 敘述統計:表格與圖形法 第32頁
圓形圖 圓形圖 (pie chart) 是另一種表示類別資料相對次數 及百分比次數分配的圖形。 圓形圖的畫法是先畫一個圓表示所有資料,再依各 資料組的相對次數將圓形分為對應的扇形部分。 例如,Coca-Cola 之相對次數為 0.38,因此 Coca- Cola 所占圓形的部分相當於圓心角 0.38 × 360 = 136.8 度的扇形,而 Diet Coke 所占圓形的部分相當 於圓心角 0.16 × 360 = 57.6 度的扇形。同理,其他 三種品牌亦可得到相對應的扇形,結果如圖 2.2。 扇形內的數值可以是次數、相對次數或百分比次數 。 第2章 敘述統計:表格與圖形法 第33頁
圓形圖 第2章 敘述統計:表格與圖形法 第33頁
圓形圖 第2章 敘述統計:表格與圖形法 第34頁
評註 通常,次數分配的組數和資料的類別總數相同。 就如表2.1 的資料顯示,該資料有五種軟性飲料 ,每種品牌便是次數分配的一組。如果資料包括 所有軟性飲料,則將有資料個數非常少的組別出 現在次數分配裡 (甚至有購買次數為0 的軟性飲 料產品) 。大部分的統計學家建議這些觀察值次 數非常少的組別彙整為同一組,組名可取為「其 他」。次數在5% 以下的組別,通常會依上述方 式處理。 次數分配的加總應等於觀察值的總數;相對次數 的總和必須為1.00;百分比次數分配的百分比總 和則應為100。 第2章 敘述統計:表格與圖形法 第34頁
2.2 定量資料的彙總 次數分配 相對次數分配與百分比次數分配 點圖 直方圖 累積分配 莖葉圖 第2章 敘述統計:表格與圖形法 第37-45頁
次數分配 範例:Sanderson and Clifford公司 第2章 敘述統計:表格與圖形法 第37頁
次數分配 為定量資料做次數分配有以下三個步驟: 決定不相重疊的組別數目。 決定每一組的組寬。 決定每一組的組界。 第2章 敘述統計:表格與圖形法 第37-38頁
組數 組數 (number of classes) 可經由資料裡資料值的範 圍來規定 。 一般而言,我們建議將資料分成 5 至 20 組。資料數量較少,通常分成 5 或 6 組 即可,較多的資料需要較多組數。 分組時,我們希望使用夠多的組數來表 示資料的變化性,但也不希望組數太多 ,而每組卻只包含很少的資料數。 由於表 2.4 的資料較少 (n=20),我們 將分5 組來建構次數分配。 第2章 敘述統計:表格與圖形法 第37-38頁
組距 建立定量資料次數分配的第二個步驟是設定各組組 距。 建議每組均採用相同的寬度。 組數與組距(width of the classes) 是相關的。 第2章 敘述統計:表格與圖形法 第38頁
組距 稽核天數的資料顯示,最大值與最小值分別為 33 與12,由於已決定組數為 5,利用式 (2.2) 得出近似 組距為 (33−12)/5 = 4.2 。 因此,我們決定採用 5 天為次數分配的組距。 一旦決定組數後,再利用式 (2.2) 求出近似組距。 也可以重複此程序,以不同組數來求出組距。 最後,分析人員都要判斷組數與組距如何配合,以 決定彙總資料的最佳次數分配。 第2章 敘述統計:表格與圖形法 第38頁
組界 選定組界 (class limits) 後,必須使每個資料只屬於 一組,而且是唯一一組。 下組界 (lower class limit) 是該分組的最小可能值; 上組界 (upper class limit) 則是最大可能值。 如果是類別資料的次數分配,不必特意決定組界, 因為每個資料會自然歸屬於一組 (類別) 。 決定組數、組距及組界後,便可經由計數落於每組 內的資料個數來建構次數分配表。 第2章 敘述統計:表格與圖形法 第38-39頁
組界 運用表 2.4 的資料,我們以 10 天為第一組的下組界, 14 天為第一組的上組界。 表 2.5 將第一組標示為 10–14 。資料的最小值 12,落 在 10–14 這組。第二組的下組界是 15,上組界是 19 。 整個資料被分為 5 組,分別是:10–14、15–19、20–24 、25–29 及30–34 。 資料的最大值是33,落在 30–34 這組。 相鄰兩組的下組界之間的差異便是組距。 利用前兩組的下組界 10 及 15,我們知道組距為 15 − 10 = 5。 第2章 敘述統計:表格與圖形法 第38-39頁
組界 由表 2.5 的次數分配,我們可知: 最常發生的稽核時間介於15–19 天。 20 筆稽核時間有 8 筆。 僅有一個稽核時間超過30 天以上。 第2章 敘述統計:表格與圖形法 第39頁
組中點 在某些應用中,我們會想知道定量資料次數分配的 組中點。 組中點 (class midpoint) 指的是上組界及下組界的 中間值,在稽核時間的資料中,5 個組中點分別是 12、17、22、27 及 32 。 第2章 敘述統計:表格與圖形法 第39頁
相對次數分配與百分比次數分配 定量資料的相對次數與百分比次數分配的定義,與 前述類別資料相同。首先,所謂的相對次數是某組 的資料個數占資料總數的比率。有 n 個觀察值時, 而百分比次數則是相對次數乘上 100。 第2章 敘述統計:表格與圖形法 第39頁
相對次數分配與百分比次數分配 根據表 2.5 的次數分配和 n=20,表 2.6 顯示稽核 時間資料的相對次數分配與百分比次數分配。 其中,有 0.40 或 40% 的稽核需要 15 至 19 天。 僅 0.05 或 5% 的稽核需要 30 天以上。 如前所述,可以由表 2.6 得到與資料相關的更多解 釋與洞察。 第2章 敘述統計:表格與圖形法 第39頁
相對次數分配與百分比次數分配 第2章 敘述統計:表格與圖形法 第39頁
點圖 點圖 (dot plot) 是最簡單的圖形彙總之一。 水平軸表示資料的值域,因此每個資料值均以點表 示在水平軸上方的適當位置。 第2章 敘述統計:表格與圖形法 第39頁
點圖 圖 2.4 為表 2.4 的點圖。 圖中有 3 個點位於 18,表示稽核時間 18 天,共有 三次。 點圖除了可以表示詳細資料外,在比較兩個或以上 變數的資料分布時也非常有用。 第2章 敘述統計:表格與圖形法 第39-40頁
直方圖 另一個常見的定量資料圖形表示是直方圖 (histogram) 。 直方圖可以用來呈現以次數分配、相對次數分配或 百分比次數分配彙整的資料。 直方圖的作法是將我們感興趣的變數置於橫軸,而 次數、相對次數或百分比次數則置於縱軸。 每組的次數、相對次數或百分比次數以矩形圖表示 ,其寬度是該組的組距,高度則是相對應的次數、 相對次數或百分比次數。 第2章 敘述統計:表格與圖形法 第40頁
直方圖 圖 2.5 是稽核時間的直方圖,其中次數最多的是 15–19 天這一組,矩形高度顯示該組次數為 8 。 相對次數或百分比次數的直方圖與圖 2.5 相同,只 是縱軸改為相對數值或百分比數值。 如圖 2.5 所示,與長條圖不同的是,直方圖裡兩相 鄰組別的矩形是相接的,相鄰組別沒有自然的分界 。 由於稽核時間的各組分別為 10–14、15–19、20–24 、25–29 及 30–34,所以組間應有一單位的區隔: 14–15、19–20、24–25 及 29–30 。 第2章 敘述統計:表格與圖形法 第40頁
直方圖 第2章 敘述統計:表格與圖形法 第40頁
直方圖 但在畫直方圖時,刪除這些間隔。刪除直方圖的組 間間隔有助於表示:所有稽核時間都在第一組的下 組界及最後一組的上組界之間。 直方圖最重要的用處之一,是讓我們瞭解資料分布 的形狀或形式。圖 2.6 中有四個相對次數分配的直 方圖。 第2章 敘述統計:表格與圖形法 第40頁
直方圖 圖 A 顯示資料的分布 呈現適度左偏 (skewed to the left),這是指分 布形狀的左尾 (左端) 延伸得較遠。 此種直方圖常見於考 試成績的次數分配。 因為分數不會高於 100%,大部分的成績 通常高於 70%,很低 的分數則比較少見。 第2章 敘述統計:表格與圖形法 第40-41頁
直方圖 圖 B 則是適度右偏 (skewed to the right) 的 直方圖,這是指分布 形狀的右尾 (右端) 延 伸得較遠。 購屋價格就是此種直 方圖的常見例子,少 數的豪宅會使資料的 右尾延伸。 第2章 敘述統計:表格與圖形法 第40-41頁
直方圖 圖 C 是對稱的直方圖 ,此圖的左尾是右尾 的鏡射。實務的資料 畫出的直方圖不會完 全對稱,但是會大致 對稱。 此種直方圖常見於考 試成績的次數分配。 諸如 SAT 成績、身高 或體重之類的資料都 是大致對稱的形式。 第2章 敘述統計:表格與圖形法 第41頁
直方圖 圖 D 則是高度右偏, 此圖的資料來自某女 性服飾店的顧客一日 採購金額。 商業經濟的實際應用 常可見此種右偏的直 方圖,例如,購屋價 格、薪水、採購金額 等。 第2章 敘述統計:表格與圖形法 第41頁
累積分配 累積次數分配(cumulative frequency distribution) 是次數分配的變化形式,它為定量資料提供另一種 表格化的彙總。 累積次數分配利用次數分配的組數、組距及組界來 進行資料的表格化彙總。 它並不列出每組的資料次數,而是列出小於或等於 每組上組界的總資料次數。 第2章 敘述統計:表格與圖形法 第41頁
累積分配 表2.7 中的前兩欄是稽核時間資料的累積次數分配 值。 第2章 敘述統計:表格與圖形法 第41-42頁
累積分配 累積相對次數分配 (cumulative relative frequency distribution) 表示小於或等於該組上組界的資料項 目的比例。 累積百分比次數分配 (cumulative percent frequency distribution) 則表示小於或等於該組上組 界的資料項目的百分比。 第2章 敘述統計:表格與圖形法 第42頁
莖葉圖 莖葉圖 (stem-and-leaf display) 是可同時顯示資料 的順序及分配形狀的圖形表示。 為了說明莖葉圖的用法,以表 2.8 的資料為例。這 些資料是 50 位哈斯肯斯公司 (Haskens Manufacturing) 的應徵者參加能力測驗的結果,這 項測驗共有 150 道題目,這些資料代表應徵者答對 的題數。 每個資料的十位數安排到垂直線的左邊,且由小至 大依序排列;垂直線的右邊則記錄每個資料的個位 數,所放的位置須對應十位數的位置。 第2章 敘述統計:表格與圖形法 第42頁
莖葉圖 第2章 敘述統計:表格與圖形法 第42頁
莖葉圖 將資料重新安排如上述的形式後,資料排序就非常 簡單。排序完成後,即完成莖葉圖如下。 第2章 敘述統計:表格與圖形法 第43頁
莖葉圖 垂直線左邊的數字 (6、7、8、9、10、11、12、13 與 14) 是莖 (stem),線右邊每一個數字是葉 (leaf) 。 第2章 敘述統計:表格與圖形法 第43頁
莖葉圖 例如,第1 列的 6 是莖,8 和 9 是葉。 這表示有兩個資料值的第一個位數是 6,葉的數值 顯示兩個資料是 68 與 69 。同理,第 2 列是 表示第一個位數是 7 的資料有 6 筆:72、73、73、 75、76 及 76 。 第2章 敘述統計:表格與圖形法 第43頁
莖葉圖 為了強調莖葉圖的形狀,我們利用長方形將每個莖 對應的葉的部分框起來。如此一來,我們便可得到 以下的表示圖: 逆時針方向將此頁旋轉90 度,則得到一個組界為 60–69、70–79、80–89 等的直方圖。 第2章 敘述統計:表格與圖形法 第43-44頁
莖葉圖 莖葉圖有兩個主要優點: 莖葉圖較容易手繪。 在一個組別區間內,由於莖葉圖列出所有實際資料值, 故能提供比直方圖更詳細的資訊。 第2章 敘述統計:表格與圖形法 第44頁
莖葉圖 莖葉圖亦沒有絕對的列或莖的數目。 可將原始資料的第一個數字再分成兩個或兩個以上 的莖。 莖葉圖以單一個數字來定義葉的值,葉單位顯示莖 葉圖的數字應乘上的適當倍數。如此一來,莖葉圖 即可近似原始資料。葉單位可以是 100、10、1、 0.1 等。 葉的部分只用一位數字,這表示莖葉圖只用到每一 資料值的前三位數。 第2章 敘述統計:表格與圖形法 第44頁
評註 長條圖與直方圖基本上是相同的;兩者都是次數 分配資料的圖形表示。直方圖是長條之間沒有間 隔的長條圖。對某些離散類別資料而言,長條間 有間隔是恰當的,例如,大學院校中註冊學生的 班級數。可以假設資料只有整數,因為 1.5 及 2.73 等都是不可能存在的值。但是,對連續的定 量資料而言,例如,表 2.4 的稽核時間,長條之 間若有間隔就不恰當。 第2章 敘述統計:表格與圖形法 第45頁
評註 定量資料的上、下組界的適當值由資料內容的精 確程度來決定。以表 2.4 稽核時間的組界資料為 例,組界是整數值。如果資料被四捨五入到小數 點後一位的精確程度 (例如 12.3、14.4 等),組界 也要表示成小數點後一位 10.0–14.9 的形式。若 將資料被四捨五入到小數點後二位的精確程度 ( 例如 12.34、14.45 等),組界也就表示成 10.00– 14.99 的形式,例如第一組的組界是 10.00–14.99 。 第2章 敘述統計:表格與圖形法 第45頁
評註 所謂的開放 (open-end) 組僅需上組界或下組界。 例如,表 2.4 的稽核時間資料,假設有 58 天與 65 天兩個值。我們不再將資料分成 35–39、40– 44、45–49 等以 5 為組距的各組,而是讓次數分 配簡化成一個開放組別「35 或以上」。這組只 有 58 天和 65 天兩個資料。通常開放組是在上組 界採開放形式,有時開放組是下組界採開放形式 ,偶爾會有兩端都採開放形式的分組方式。 第2章 敘述統計:表格與圖形法 第45頁
評註 累積次數分配的最後一組一定會等於觀察值總次 數,在累積相對次數分配的最後一組一定是 1.00 ,累積百分比次數分配裡則一定等於 100。 第2章 敘述統計:表格與圖形法 第45頁
2.3 運用表格彙總兩變數的資料 管理者或決策者經常需要運用表格彙總雙變數資料。 各種探索雙變數關係的圖示如散布圖及趨勢線,能 夠產生有力的洞察,且讓得以根據個人視覺上的比 較、對照及認知類型的能力。 資料可視化的目的是盡可能清晰且有效率地溝通相 關資料的關鍵訊息。 第2章 敘述統計:表格與圖形法 第50-69頁
2.3 運用表格彙總兩變數的資料 交叉表格 辛浦森詭論 第2章 敘述統計:表格與圖形法 第50-54頁
2.3 運用表格彙總兩變數的資料 到目前為止,介紹的都是彙總單一類別變數資料或 定量變數資料的表格與圖形化方法。 管理者或決策者經常需要彙總雙變數的資料以瞭解 雙變數間的關係—如果有的話。 交叉表格與散布圖即彙總兩變數之資料的方法。 第2章 敘述統計:表格與圖形法 第50頁
交叉表格 交叉表格(crosstabulation) 是雙變數資料的表格彙 總。 交叉表格可以使用在: 一個類別變數,其他類別為定量變數 兩個變數都是類別變數 兩個變數都是定量變數 常見的交叉表格,變數之一是定量資料,另一變數 則是類別資料。 表的最左欄與最上列的標記是兩個變數的類別。 第2章 敘述統計:表格與圖形法 第50頁
交叉表格實例 Zagat’s Restaurant Review 刊載的資料來自洛杉磯地 區 300 家餐廳所構成的品質評等與餐點價格樣本。 品質評等是一個類別變數,其類別有好 (good)、很 好 (very good)、特優 (excellent) 三個等級,餐點價 格為定量變數,範圍從 $10 到 $49 之間。 表 2.9 顯示前 10 家餐廳的資料。 第2章 敘述統計:表格與圖形法 第50頁
交叉表格實例 第2章 敘述統計:表格與圖形法 第51頁
交叉表格實例 此例的交叉表格如表2.10 。 表的最左欄與最上列的標記是兩個變數的類別 (組 別),表的左邊第1 欄中有三個等級 (好、很好、特 優) 對應品質評等變數的三個類別。 在表的第1 列,欄的標籤 ($10–19、$20–29、$30– 39 及 $40–49) 表示被分為四組的餐點價格。 第2章 敘述統計:表格與圖形法 第50-51頁
交叉表格實例 由於每個餐廳均提供品質評等與餐點價格資料。因此 ,每個餐廳都可歸屬於交叉表格中的某個方格 (cell) 。 例如,表 2.9 顯示第 5 家餐廳的品質評等是很好,餐點 價格則是 $33 。這家餐廳應該落在表 2.10 中第 2 列與 第 3 欄交叉的方格內。在建立交叉表格時,我們只要 計算方格內的餐廳數目。 類別變數 定量變數 第2章 敘述統計:表格與圖形法 第51頁
交叉表格實例 品質評等的次數分配 餐點價格的次數分配 第2章 敘述統計:表格與圖形法 第51頁
交叉表格實例 將交叉表格最右欄的次數除以總次數,即得到品質 評等的相對次數及百分比次數分配。 各個欄位的加總並未恰好等於總和,這是因為經過四捨五入的運算而產生的結果。由百分比次數分配可以很快看出,26% 的餐廳之餐點價格是在最低價($10−19) 的組別,39% 的餐廳則落在下一組。 第2章 敘述統計:表格與圖形法 第51-52頁
交叉表格實例 將交叉表格最後一列除以總次數,可得到餐點價格 的相對次數及百分比次數分配。 請注意,因為經過四捨五入的運算,相對次數的加 總不一定恰好等於1,百分比次數的加總不一定恰 好等於 100 。 第2章 敘述統計:表格與圖形法 第52頁
交叉表格實例 將交叉表格中之次數轉換成百分比,能讓我們更瞭 解變數間的關係。例如,表 2.10 中將各方格的數 值除以其對應列的總次數,而得到表 2.11 。 第2章 敘述統計:表格與圖形法 第52頁
交叉表格實例 交叉表格被廣泛使用於檢視雙變數間的關係。實務 上,許多統計調查的最終報告包含很多交叉表格。 在洛杉磯餐廳調查中,交叉表格內有一個類別變數 (品質評等) 及一個定量變數 (餐點價格) 。 兩個變數均為類別變數或定量變數時也能夠建立交 叉表格。 第2章 敘述統計:表格與圖形法 第52頁
辛浦森詭論 兩個或更多的交叉表格常會被整合成一個彙整的交 叉表格,以顯示雙變數間的關聯。 在這些情況下,由彙整兩個或更多個別的交叉表格 而得到的結論可能與整合為單一交叉表格得到的結 論恰恰相反,此種現象稱為辛浦森詭論(Simpson’s paradox) 。 第2章 敘述統計:表格與圖形法 第53頁
2.4 以圖形彙總雙變數資料 大部分情況下,以圖示來辨識資料的類型或趨勢比 較有用。 有創意地呈現資料,能夠產生有力的洞察,並且讓 我們得以根據個人視覺上的比較、對照及認知類型 的能力,做出「常識的推論」。 第2章 敘述統計:表格與圖形法 第58頁
散布圖與趨勢線 散布圖 (scatter diagram) 是表示兩定量變數間關係 的圖形。 一個變數顯示在縱軸而其他變數則顯示在橫軸。 趨勢線 (trendline) 則是近似關係的直線。 第2章 敘述統計:表格與圖形法 第58頁
散布圖與趨勢線實例 以舊金山地區音響設備店的銷售與廣告關係為例來 說明。過去 3 個月內,音響設備店利用週末的電視 廣告進行促銷推廣的次數為 10 次,經理要調查廣 告出現次數與接下來 1 週的銷售額是否有關。表 2.14 是為期 10 週的銷售量樣本,單位是 $100。 第2章 敘述統計:表格與圖形法 第58頁
散布圖與趨勢線實例 第2章 敘述統計:表格與圖形法 第59頁
散布圖與趨勢線實例 圖 2.7 為表 2.14 資料的散布圖與趨勢線。橫軸為廣 告次數 (x),縱軸為銷售額 (y) 。 第2章 敘述統計:表格與圖形法 第58-59頁
散布圖與趨勢線實例 圖 2.7 的散布圖顯示廣告次數與銷售額呈正向的關 係,較高的銷售額對應較高的廣告次數。 由於散布圖上的點並非全在同一條直線上,銷售額 與廣告次數並非完全的正比關係。 從一般型態來說,銷售額與廣告次數的關係仍為正 向。 第2章 敘述統計:表格與圖形法 第59頁
散布圖與趨勢線實例 第2章 敘述統計:表格與圖形法 第59頁
散布圖與趨勢線實例 圖 2.8 是一般的散布 圖型態與相關形式。 左邊的散布圖型態類 似之前說明的廣告次 數與銷售額的例子, 為正相關型態。 第2章 敘述統計:表格與圖形法 第59-60頁
散布圖與趨勢線實例 圖 2.8 是一般的散布 圖型態與相關形式。 左邊的散布圖顯示變 數間無明顯相關。 第2章 敘述統計:表格與圖形法 第59-60頁
散布圖與趨勢線實例 圖 2.8 是一般的散布 圖型態與相關形式。 左邊的散布圖是負相 關,此處的 y 會隨著 x 的增加而遞減。 第2章 敘述統計:表格與圖形法 第59-60頁
群組長條圖 群組長條圖(side-by-side bar chart) 是在同張圖形 上描繪多個長條圖。 每個條列都表示第一個變量的一個值。 群組中的每個欄表示第二個變量的一個值。 第2章 敘述統計:表格與圖形法 第60頁
群組長條圖實例 圖 2.9 是餐廳資料的群組長條圖。長條顏色表示品 質評等 (淺藍色:好,灰色:很好,以及深藍色: 特優) 。 每個長條延伸的長度是每個餐點價格類別中,某類 品質評等出現的次數。 將每個餐點價格類別的品質評等次數相鄰地排列在 一起,可以讓我們很快看出某特定餐點價格類別在 品質上如何被評比。 第2章 敘述統計:表格與圖形法 第60頁
群組長條圖實例 第2章 敘述統計:表格與圖形法 第61頁
堆疊長條圖 另一種表示及比較兩變數的圖形。 堆疊長條圖 (stacked bar chart) 的每個長條是標示 為不同顏色的矩形,這些矩形就如圓形圖一樣可表 達每組相對次數。 將每欄的各個元素除以該欄總和,即可將次數資料 轉換為百分比。 第2章 敘述統計:表格與圖形法 第60-61頁
堆疊長條圖實例 表 2.15 顯示每個餐點價格組別的欄百分比。運用 表 2.15 的資料,可以建構出圖 2.10 的堆疊長條圖 。 第2章 敘述統計:表格與圖形法 第61頁
堆疊長條圖實例 第2章 敘述統計:表格與圖形法 第61頁
堆疊長條圖實例 相較於圖2.9,圖2.10 更清楚顯示出變數間的關係 。 當我們由較低的價格分組 ($10–19) 到較高的價格分 組 ($40–49),淺藍色長條的長度減少,而深藍色長 條的長度增加。 第2章 敘述統計:表格與圖形法 第61頁
評註 時間序列是在連續時點或連續時期測量變數而得 到的一系列觀察值。將時間表示於橫軸,時間序 列值表示於縱軸的散布圖,在時間序列分析中被 稱為時間序列圖。 堆疊長條圖也可用於表示次數而非百分比次數。 此種狀況下,長條中不同顏色的區塊表示次數而 非百分比。 第2章 敘述統計:表格與圖形法 第62頁
2.5 資料可視化:建立有效圖形表示的最佳作法 「資料可視化」一詞是描述以圖形表示來彙整並呈 現資料集合的訊息。 資料可視化的目的是盡可能清晰且有效率地溝通相 關資料的關鍵訊息。 第2章 敘述統計:表格與圖形法 第64頁
建立有效圖形表示 建立有效的圖形表示既是科學也是藝術。 遵守以下指導方針可提升圖形有效傳達訊息的可能 性。 給圖形一個清晰又簡潔的標題。 圖形要簡單。如果兩維就足夠,不要用三維。 每個座標軸要有清楚標示,要有軸的刻度。 如果要用顏色來區分類別,確認顏色有明顯不同。 如果使用多種顏色及線條樣式,使用圖例說明來定義顏 色及線條的用法,圖例說明就放在資料圖形旁邊。 第2章 敘述統計:表格與圖形法 第65頁
選擇圖形表示的類別 用於表示資料分配的圖形 長條圖—用來表示類別資料的次數及相對次數 圓形圖—用來表示類別資料的相對次數及百分比次數 點圖—用來表示定量資料在整個資料範圍中的分布 直方圖—用來表示定量資料在分組區間中的次數分配 莖葉圖—用來表示定量資料的順序及分布形狀 第2章 敘述統計:表格與圖形法 第65-66頁
選擇圖形表示的類別 用於進行比較的圖形 用於表示關係的圖形 群組長條圖—用來比較兩個變數 堆疊長條圖—用來比較兩個類別變數的相對次數或百分比 次數 用於表示關係的圖形 散布圖—用來表示兩個定量變數的關係 趨勢線—用來近似散布圖中資料的關係 第2章 敘述統計:表格與圖形法 第66頁
資料儀表板 資料儀表板 (data dashboard)是最常用於資料可視 化的工具 。 資料儀表板是將用來監控企業或組織的績效的種種 資訊,以易於判讀、瞭解及解釋的方法予以整編和 呈現的一組視覺化表現。 每個企業需要監控關鍵績效指標 (key performance indicator, KPI) 以評估企業經營成果。 。KPI 的例 子有存貨、每日銷貨、及時配送的百分比與每季銷 貨收入等。 第2章 敘述統計:表格與圖形法 第66頁
資料儀表板 我們以 Grogan 石油公司的例子,說明資料儀表板 在決策制定的應用。 圖 2.12 的資料儀表板用來監控 IT 服務中心的績效 。 資料儀表板整合若干種圖示以監控服務中心的 KPI 。 第2章 敘述統計:表格與圖形法 第66頁
資料儀表板 第2章 敘述統計:表格與圖形法 第67頁
資料儀表板 之前討論的運用於資料儀表板的個別圖形的可視化 指導方針也可適用整個資料儀表板。 除了上述守則外 重要的還有讓螢幕捲動的需求降到最小 避免使用無謂的顏色或立體圖形 圖形間加邊線以增加可讀性 就像個別圖形一樣,愈簡單愈好 第2章 敘述統計:表格與圖形法 第68頁
表格法與圖示法 第2章 敘述統計:表格與圖形法 第70頁
End of Chapter 2