統計學 郭信霖 許淑卿
第二章 資料的蒐集、整理與陳示 2-1 資料的種類 2-2 資料的衡量尺度 2-3 資料的蒐集方法 2-4 次數分配表 2-5 統計圖 2-1 資料的種類 2-2 資料的衡量尺度 2-3 資料的蒐集方法 2-4 次數分配表 2-5 統計圖 2-6 次數分配的型態 2-7 加總符號 2-8 電腦範例 2-9 流程圖
2-1 資料的種類 一、以資料的來源分 1. 原始資料(primary data)又稱為直接資料。 2-1 資料的種類 一、以資料的來源分 1. 原始資料(primary data)又稱為直接資料。 2. 次級資料(secondary data)又稱為間接資 料。 二、以資料的性質分 1. 靜態資料(static data) 2. 動態資料(dynamic data)
三、以資料構成分 1. 屬性資料(qualitative data) 屬量資料(quantitative data)分成計數資料 和計量資料 (1) 計數資料:以點計方法,所得到的資料。 (2) 計量資料:以測量或度量方法,所得到的資料。
※ 2-2 資料的衡量尺度 常用的衡量尺度可分為名目尺度(nomial scale)、順序尺度(ordinal scale)、區間尺度(interval scale)及比率尺度(ratio scale)四種。 名目尺度又稱類別尺度: 名目尺度係為了標示目的而指定的數字,僅用以衡量類別或名目資料,只能命名或分類僅以代號來表示。
順序尺度: 順序尺度為只能指出等級或順序,但不能衡量不同等級間的距離,故僅用以衡量各類別間可區分出先後、等級、強弱的資料。 區間尺度又稱等距尺度: 區間尺度用以衡量有任意原點(零點可任意選定)的數量資料,彼此間有大小順序,數值間的距離有意義,可衡量絕對大小,可作加減運算,但乘除和比率無意義。
四、比率尺度又稱等比尺度: 比率尺度用以衡量有絕對原點(獨一無二的零點)的數量資料,數值間有大小順序,可衡量絕對大小,四則運算皆有意義。
將上面四種衡量尺度,以下面的例子表示。 衡量尺度 某大專院校的姓名 郭同學 何同學 高同學 許同學 名目 學號 950026 940017 960121 951123 順序 成績等第 甲 乙 區間 TOFEL的分數 165 160 150 180 比率 體重(公斤) 60 53 56 61
2-3 資料的蒐集方法 蒐集的方法視不同的需要,大約有下列四種方法可供選擇: 一、調查法(Survey) (一)普查 2-3 資料的蒐集方法 蒐集的方法視不同的需要,大約有下列四種方法可供選擇: 一、調查法(Survey) (一)普查 (二)抽查:『亂數表法』或『隨機號碼表(random numbers)』 直接調查法又分為:(1)面對面訪問 (2)電話訪問 (3)郵寄問卷 (4)上網問卷
二、觀察登記法(observation and registration) 三、實驗法(experiment) 四、次級資料的搜集
2-4 次數分配表 分別針對屬量、屬性資料的製表加以說明: 2-4.1 屬量資料的製表 一、順序序列 2-4 次數分配表 分別針對屬量、屬性資料的製表加以說明: 2-4.1 屬量資料的製表 一、順序序列 若有一組資料的個數很少時,可以順序序列的方式表示之。 設有一組X1,X2,……,Xn樣本資料,則將Xi序列由小到大排列,可得X(1) X(2) …… X(n) 其X(1) = min{X1,X2,……,Xn},X(n) = max{X1,X2,……,Xn}
二、次數分配 次數分配表有簡單次數分配表(simple frequency table)與分組次數分配表(classified frequency table)兩種形式。 其編製次數分配表的步驟大致如下: 1. 求全距(Range):以R = X(n) - X(1)表示 2. 定組數(class number):以k表示
3. 定組距(class interval):以h = R / k表示 為了使全部資料皆容納於所分割的組別中,則h k > R,故h可取較R / k稍大的數字而且位數要與原資料的位數相同。 4. 定組限(class limit)或組界(class boundary) 分組後各組之界限,稱為組限,一為組上限(class upper limits),另一為組下限(class lower limits)。
則L 1 = X(1) - , Uk = X(n) +
A(組限) B(組限) C(組界) 組中點 10~20 10~19 9.5~19.5 15 (表示10 X < 20) (表示10 X 19) (表9.5 < X < 19.5) 20~30 20~29 19.5~29.5 25 30~40 30~39 29.5~39.5 35
因此建立次數分配表或劃定組限時,應符合互斥與周延兩原則; 所謂互斥是指各組之間沒有交集,表示毫無重複的現象。 所謂周延是指每個資料可歸入某一組中,表示毫無遺漏。
5. 歸類與計算每組之組次數其編製之流程圖如下: 5. 歸類與計算每組之組次數其編製之流程圖如下: 圖2-2 次數分配之編製流程
(三) 累積次數分配(cumulative frequency distribution) 所謂『以下累積次數』是指小於每組組上限的次數總和,通常以Fi表示。 所謂『以上累積次數』是指大於每組組下限的次數總和。
2-4.2 屬性資料的製表 屬性資料是以類別的型態呈現出來,其製表可依循原資料的類別進行,分別介紹以下: 一、次數分配表的意義 次數分配表又稱分組次數表,乃是按照觀測值的大小,先將其分為若干組,稱之為分組;然後再歸類組次數,通常以fi表示;整理成表的形式,便稱為次數分配表(frequency distribution)。
二、相對次數分配、百分比分配 所謂相對次數,就是某類別(組)次數佔全部資料的比例,即 相對次數= = 或 , n = (或N = )。
三、交叉分類表-列聯表(contingency table) 表2-9 性別與抽煙之列聯表 表2-9 性別與抽煙之列聯表 抽煙否? 性別 會 不會 行合計 男 40 20 60 女 10 30 列合計 50 100
2-5 統計圖 繪製圖形的目的是為了能將資料的特性正確而且清楚的呈現出來。 有關統計圖的形式大致上可依屬量、屬性資料分別說明: 2-5 統計圖 繪製圖形的目的是為了能將資料的特性正確而且清楚的呈現出來。 有關統計圖的形式大致上可依屬量、屬性資料分別說明: 一、屬量資料的繪圖
(一) 間斷性資料的繪圖 關於間斷性資料的繪圖,在此介紹三種: 1. 點圖(dot plot) 圖2-3 看電影次數的點圖
2. 長條圖(bar chart) 圖2-4 看電影的次數長條圖
3. 直方圖(histogram) 次數直方圖 相對次數直方圖 累積次數直方圖 圖2-5 看電影的次數直方圖
(二) 連續性資料的繪圖 連續性資料的圖示法,較常用的有點圖、直方圖、次數多邊圖(polygon)、肩形圖(ogive)又稱累積次數多邊圖(cumulative frequency polygon)及枝葉圖(stem and leaf display)。 1. 點圖(dot plot) 2. 直方圖(histogram)
圖2-7 體重的次數直方圖
3. 次數多邊圖(polygon) 圖2-8 體重的次數多邊圖
4. 累積次數多邊圖---肩形圖(ogive) 累積次數多邊圖:以下累積、以上累積兩種型式。 以下累積的肩形圖是連接各組的組上界, 以上累積的肩形圖是連接各組的組下界。 由肩形圖可以知道有多少次數或多少百分比的觀測值低於某一特定值。
圖2-9 體重之肩形圖
其應用有下列兩種問題: 1. 已知某一個資料,求在此資料的以下百分比、以下累積次數? 2. 已知某一個資料的以下累積次數,求此資料的數值。
二、屬性資料的繪圖 屬性資料的繪圖:點圖(dot plot)、長條圖(bar chart)、圓形圖(pie chart)表示。
圖2-12 百分比點圖
圖2-13 百分比長條圖
圖2-14 百分比圓形圖
2-6 次數分配的型態 各種不同性質的現象,就呈現著不同的次數分配,主要有下列幾種: 2-6 次數分配的型態 各種不同性質的現象,就呈現著不同的次數分配,主要有下列幾種: (一) 對稱分配(symmetrical frequency distribution) 次數分配的絕大多數,是屬於中間的部份次數最多,左右兩邊的次數逐漸減少,成為對稱分配。如下圖:
(a) 雙峰對稱分配 (b) 單峰對稱分配,又稱鐘形分配 圖2-15 對稱分配圖
(二) 單峰偏斜分配 1. 右偏(skewed on night)分配又稱正偏(positive)分配。 2. 左偏(skewed on left)分配又稱負偏(negative)分配。
(a)右偏分配 (b)左偏分配 圖2-16 非對稱分配圖
如人口依年齡分配的死亡率、天空每天含烏雲的百分比等。 (三) U型分配 如人口依年齡分配的死亡率、天空每天含烏雲的百分比等。 圖2-17 U型分配圖
(四) J型分配 如投資額利潤比呈正J字型;感染日本腦炎比例呈反J字型。
(a)J字型 (b)反J字型 圖2-18 J型分配圖
2-7 加總符號 下面將介紹加總符號之基本定理: 1. = + + 表兩個或多個變數和的總和,為各變數加總之和。 2-7 加總符號 下面將介紹加總符號之基本定理: 1. = + + 表兩個或多個變數和的總和,為各變數加總之和。 2. 若c為常數,則 = c
3. 若c為常數,則 = nc 4. = - n = - , =
5. = - n = - , = , = 。
圖B 統計資料的整理與陳示流程圖 2-46