第三章 統計資料的呈現: 統計圖表
1: 產生數據 2: 整合 數據 3: 從數據中得出結論 推論正確性之判斷 資料分析解釋 問題確認 研究對象之確認 資料蒐集 資料整理 推論 統計 機率論 敘述 統計 抽樣 母體 樣本 1: 產生數據 2: 整合 數據 3: 從數據中得出結論
學習目標 利用統計圖表作資料的呈現,讓人有一目了然的感覺。 繪製屬質資料的統計圖表 繪製屬量資料的統計圖表 次數分配表、長條圖與圓形圖。 次數分配表、直方圖、多邊形圖、肩形圖、有序枝葉圖與時間數列圖。
統計圖表 統計圖表的功能 使用統計圖表之前 將數據以系統性方法呈現,使讀者一目了然, 故為描述資料(敘述統計)的重要工具之一。 需確定資料為屬質資料或是屬量資料,資料屬性不同,其適用的統計圖表亦不同。
屬質資料的統計圖表 屬質資料的次數分配表 長條圖 圓形圖
屬質資料的次數分配表 Frequency distribution table 依照資料的原始分類 分別計算各類別的出現次數 將各類別次數以表呈現。
獎號最常開出號碼前十名次數分配表(包含特別號) 樂透彩券開出號碼前十名次數分配表 獎號最常開出號碼前十名次數分配表(包含特別號) ~統計至92054期
例3.1 選修高等統計學的各系人數 假設40位選修高等統計學課程的學生所屬系別,若選修本課程是以報考研究所為主要目的,該任課老師欲瞭解哪一系學生的報考風氣較盛,試問任課老師應如何編製次數分配表,從中可以得到那些訊息?
表3.1 選修高等統計學的學生所屬系別
屬質資料的次數分配表(續) 表3.2 選修高等統計學課程的次數分配表
長條圖(直條圖) Bar chart 是由若干長條所構成 每一長條所代表的是該組的發生次數或次數百分比。
民國91年台灣地區十大癌症死因 民國91年台灣地區十大癌症死因 資料來源:行政院衛生署
例3.2 某系一年級全體同學的血型分布情形如下: A型10位、B型21位、O型60位、AB型9位,試編製血型的長條圖。
長條圖(續) 圖3.6 血型分布長條圖
圖3.7 人身保險業務員教育程度長條圖(民國88年) 例3.3 人身保險業務員的教育程度 表3.3是民國88年人身保險業務員的教育程度,依男性、女性及總人數繪製教育程度長條圖,如圖3.7。 圖3.7 人身保險業務員教育程度長條圖(民國88年) 資料來源:壽險公司(民國89年)
圓形圖 Pie chart 以圓形的三百六十度為百分之百 各分類所占的次數百分比即為扇形的角度。 事實上,只要欲表達某類別佔全部的比例,以 的呈現最為合適。
求職者學歷分布 台灣地區求職者學歷分布—調查期間 2003年5月10日 資料來源:中時人力網
例3.4 飲料種類的消費情形 表3.4呈現某校大一200位學生對飲料的喜好情形。 表3.4 學生對飲料種類的喜好情形 種類 茶 碳酸 運動 例3.4 飲料種類的消費情形 表3.4呈現某校大一200位學生對飲料的喜好情形。 表3.4 學生對飲料種類的喜好情形 種類 茶 碳酸 運動 咖啡 機能 果汁 水 其他 合計 人數 36 34 16 40 30 20 18 6 200
例3.4 飲料種類的消費情形(續) 將表3.4之數據以圓形圖表示各類的分布情形,如圖3.8所示。 圖3.8 飲料種類的圓形圖
圓形圖(續) 圖3.9 選修高等統計學課程的圓形圖
屬量的統計圖表 有序枝葉圖 屬量資料的次數分配表 直方圖 多邊形圖 肩形圖 時間數列圖
有序枝葉圖 有序枝葉圖 將資料由 到 依序排列,將每一觀察值分成兩部分,一部分屬於「枝」, 其餘(最後一位數)的屬於「葉」,完整呈現資料的基本特性。 有序枝葉圖的重要性 可以洞悉資料的集中與分散情形,對於資料特性的掌握相當有幫助。
例3.7 驚人的銀行逾放比 最近幾年國內的經濟持續惡化,尤其是銀行的呆帳漸多,因而造成逾放比的節節上升,表3.5為國內二十家銀行的逾放比資料。
表3.5 國內20家銀行的逾放比(民國89年) (單位:%)
例3.7 驚人的銀行逾放比(續) 解答:取個位數為枝,小數點第一位為葉。 (單位: 1)
例3.7 驚人的銀行逾放比(續1) 由圖可知,資料分布非常不對稱,逾放比最高的是9%,遠超出大多數的銀行,出現頻率最高的是2%至2.9%這一組。
例3.6 您的統計成績如何? 某校抽樣50位同學的統計學期中考成績如下: 39 77 67 72 52 83 66 84 59 63 例3.6 您的統計成績如何? 某校抽樣50位同學的統計學期中考成績如下: 39 77 67 72 52 83 66 84 59 63 75 94 84 73 81 41 61 51 91 87 34 54 71 47 79 70 65 57 90 83 58 69 82 76 71 60 38 81 74 69 68 76 85 58 45 73 75 42 93 65 試繪製有序枝葉圖,利用所得圖形說明成績的集中情形與分散情形。
例3.6 您的統計成績如何?(續) 圖3.10 統計學期中考成績的有序枝葉圖 (單位: 1)
屬量資料的次數分配表 建立屬量資料的次數分配表的步驟 資料排序 求全距 R 決定組數 k 方法一: 取 k等於 的整數。 方法二: 求最小的 k 值,使得 2k n。 方法三: Sturge’s formula k = 1+3.32log10n。
屬量資料的次數分配表(續) 決定組距 組距(d) = 全距(R)∕組數(k) 決定組限(各組別之最小值及最大值) 劃記並計算次數
例3.8 統計成績的次數分配表 根據例3.6的資料編製統計學成績的次數分配表。 排序資料可以根據圖3.10的有序枝葉圖得知。 例3.8 統計成績的次數分配表 根據例3.6的資料編製統計學成績的次數分配表。 排序資料可以根據圖3.10的有序枝葉圖得知。 最大值為94,最小值為34,故全距 R= 利用最簡單的公式,k約等於 ,所以取 組。 根據資料得知最小計算單位為1分,由前兩項得知 全距/組 數組距d = 。
因為最小值為34,依此我們決定最小一組由33開始且組距為9,所以各組的組限分別是33-41,42-50,51-59,60-68, 69-77,78-86,87-94。 劃記並計算次數,利用前述的過程,得表3.6為統計學成績的次數分配表。
例3.8 統計成績的次數分配表 根據例3.6的資料編製統計學成績的次數分配表。
例3.9 節節上升的失業率 試依表3.7的每月失業率統計數據編製次數分配表。 解: 將資料排序後,求全距為2.88。 例3.9 節節上升的失業率 試依表3.7的每月失業率統計數據編製次數分配表。 解: 將資料排序後,求全距為2.88。 我們利用公式計算k使得 ,本例n = 44,因此k =6。 計算公式為組距=全距/組數,因此組距為0.48,為了方便計算取為組距0.5。 資料中最小值為2.29,因此我們以2.20為第一組之組下限,再者組距為0.5,所以2.69為第一組的上限,其餘各組依此類推。 劃記並計算各組次數,最後結果如表3.8所示。
表3.8 每月失業率次數分配表(民國87年1月至90年8月) 例3.9 節節上升的失業率(續) 表3.8 每月失業率次數分配表(民國87年1月至90年8月) 組界 資料來源:行政院主計處
直方圖 直方圖 組界 與長條圖非常類似,適用於連續的屬量資料,作法如同長條圖。橫軸代表各組的組界,縱軸代表各組的次數或相對次數。 組下界 = 組下限-最小計算單位∕2 組上界 = 組上限 + 最小計算單位∕2
統計學成績的直方圖
第 i 組, i = 1, 2, …, k (共有 k 組) 相對次數(relative frequency) 第 i 組的相對次數 = 第 i 組的次數 fi / 總次數 n, 累積次數(cumulative frequency) Fi = f1 + f2 + … + fi 組中點(class mid-point) 組中點 =(組下限 + 組上限)∕2 =(組下界 + 組上界)∕2
例3.10 統計學成績的直方圖(續) 圖3.12 統計學成績直方圖
例3.11 失業率的分佈情形 根據例3.9之資料畫出我國在民國八十七年一月至九十年八月的失業率直方圖。 例3.11 失業率的分佈情形 根據例3.9之資料畫出我國在民國八十七年一月至九十年八月的失業率直方圖。 圖3.13 失業率之直方圖(民國87/01至90/08)
直方圖與長條圖有何區別? 就長條的寬度而言: 就縱軸而言: 就外觀而言: 長條圖無組距及組界的觀念,其長條寬度亦不具任何意義 直方圖的橫軸代表組限(界), 其長條寬度代表組距的大小. 就縱軸而言: 長條圖的縱軸只能以次數或相對次數表示. 直方圖的縱軸可以是次數, 相對次數或累積次數表示. 就外觀而言: 長條圖之每一長條之間可以有間隙. 直方圖之每一長條皆併鄰排列.
多邊形圖(polygon) 可以由直方圖中直接得到 在第一組之前及最後一組之後各加一組當作假想組,此兩組的次數皆設為0 將 及 所構成的點連接而成。 如此可得一封閉的曲線,即由橫軸出發,最後再回到橫軸。
例3.12 統計學成績的多邊形圖 利用表3.9之資料,繪製統計學成績的多邊形圖。 圖3.14 統計學成績多邊形圖 例3.12 統計學成績的多邊形圖 利用表3.9之資料,繪製統計學成績的多邊形圖。 圖3.14 統計學成績多邊形圖 32.5 41.5 50.5 59.5 68.5 77.5 86.5 95.5
肩形圖(ogive):累積次數曲線圖 以 與 為座標 將所得的點連接起來 曲線的起點以第一組下界與次數為0的座標開始
例3.13 統計學成績的肩形圖 試利用表3.9的累積次數資料,繪製統計學成績的肩形圖。 圖3.15 統計學成績肩形圖 例3.13 統計學成績的肩形圖 試利用表3.9的累積次數資料,繪製統計學成績的肩形圖。 圖3.15 統計學成績肩形圖 32.5 41.5 50.5 59.5 68.5 77.5 86.5 95.5
時間數列圖 將 置於橫軸 將另一變數的數據置於縱軸。 這樣的圖形可讓我們瞭解經過一段時間的影響,另一變數的消長趨勢情形等。
例3.14 外匯存底消長趨勢為何? 表3.10是台灣與中國大陸自民國80年至89年的外匯存底金額,試以時間數列圖表示十年間的變化趨勢。 例3.14 外匯存底消長趨勢為何? 表3.10是台灣與中國大陸自民國80年至89年的外匯存底金額,試以時間數列圖表示十年間的變化趨勢。 表3.10 我國與中國大陸的外匯存底(民國80至 89年)(單位:億美元) 資料來源:國際金融統計(IMF)月報。
例3.14 外匯存底消長趨勢(續) 圖3.16 台灣與大陸外匯存底之時間數列圖 (民國80至89年)
金融機構逾放比 資料來源:台灣經濟研究院