第二章 資料的蒐集與整理 授課教師: 2011.02.18更新
本章重點 瞭解資料的種類 熟悉定性與定量資料的各種統計表與統計圖
大綱 資料的蒐集 資料的種類 資料的整理 定性資料常用的統計表 定量資料常用的統計表 定性資料常用的統計圖 定量資料常用的統計圖
2-1 資料的蒐集 2.1.1一手資料的蒐集 又稱為初級資料,一手資料通常是尚未存在的資料,必須透過研究者親自進行問卷調查、實驗或觀察才能獲得資料。
例1 交通部想要瞭解開放紅燈右轉是否會比較容易發生車禍,請你建議交通部蒐集資料的方法? 欲蒐集開放紅燈右轉發生車禍的次數,可採用實驗法,先開放某些特定的路段允許紅燈右轉,經過一段時間後,蒐集這些路段發生車禍的次數,再與開放前發生車禍的次數進行比較,看兩者的差距多少,以進行評估。
例 2 請你舉實際的例子,說明如何利用觀察法蒐集資料。 近年來受溫室效應的影響,每年來到台灣的候鳥數量與種類似乎有逐漸減少的趨勢。若想要瞭解氣溫對候鳥遷移數量的影響,可至候鳥遷移地進行觀察,記錄每次遷移台灣的候鳥數量與當時的氣溫。
2.2.1二手資料的蒐集 又稱為次級資料,二手資料通常是已經存在的資料,是經由他人所蒐集到的資料。二手資料的取得可透過網際網路、政府機構、企業單位、圖書館等。
每年台灣地區發生颱風時,報紙都會刊登各處的淹水報導,因此李先生可以到報社查詢報紙的歷史資料,以瞭解台北地區有哪些地方曾經因為颱風淹過水。 例 3 李先生想要在台北市購買房子,但李先生聽朋友說台北市區某些地方經常會因為颱風淹水,請問他要如何蒐集資料,取得台北市曾經淹水的地方,以避開淹水地段。 每年台灣地區發生颱風時,報紙都會刊登各處的淹水報導,因此李先生可以到報社查詢報紙的歷史資料,以瞭解台北地區有哪些地方曾經因為颱風淹過水。 圖片來源:http://www.playkid.com.tw/pics/misc/20080605_kun_shan_flood/14.jpg
例 4 很多人都說二手資料比一手資料不可靠,你的看法呢? 不一定喔!要看資料的來源以及蒐集的過程。有些二手資料是來自專業研究機構或者政府部門,由於這些機構具有龐大的資金與研究人員,因此來自這些專業機構所調查獲得的資料,有時比自己親自調查來得可靠。
2-2 資料的種類 資料的種類,除依取得方式區分外,尚可依是否包含時間因素、來源、涵蓋範圍、數學特性、資料的呈現特性與是否分組進行分類
2.2.1普查資料與抽樣資料 普查資料 抽樣資料 對欲探討的對象進行全面性調查所獲得的資料 如戶口普查、工商普查 從欲探討的對象中選取部分具代表性的資料 大部分人文社會學研究的資料型態都屬於抽樣資料
2.2.2定性資料與定量資料 定性資料 定量資料 又稱為類別資料 如性別、婚姻狀態、職業別等。定性資料僅具名義上的性質 又稱為數量資料 如年齡、身高、體重或收入等
2.2.3離散資料與連續資料 離散資料 連續資料 又稱為間斷資料 離散資料的數值衡量只能以某一特定的數值表示,兩數值間無法再進行切割 如賣場每日銷售飲料數、家庭人口數 連續資料 能以連續的數字表示,任兩數值間可以進行無限的分割 如加油站加油機器的油量誤差、台灣地區每天平均氣溫
2.2.4組距型資料與非組距型資料 組距型資料 非組距型資料 記錄時會進行分組,按區間的數值進行分類 例如記錄年齡採用:1-10歲、11-20歲、21-30歲… 非組距型資料 也稱為粗資料 記錄資料時,直接記錄其數值,沒有進行分類
2.3 資料的整理 剛蒐集到的資料通常是雜亂無章的,必需進一步將資料進行整理,才可以很容易的看出資料的意義
粗資料 整理成表 以圖形方式呈現 經過整理後的資料比較容易瞭解資料的意義 重量(公斤)3 1 20 6 10 5 7 2 11 9 重量(公斤)3 1 20 6 10 5 7 2 11 9 長度(公分)67 27 407 127 207 107 147 47 227 187 粗資料 整理成表 重量 1 2 3 5 6 7 9 10 11 20 長度 27 47 67 107 127 147 187 207 227 407 以圖形方式呈現 經過整理後的資料比較容易瞭解資料的意義
2-4定性資料常用的統計表 定性資料常用的統計表 (相對)次數配表 (相對)累積次數分配表 交叉表
2.4.1次數分配表 Excel指令說明 COUNTIF(儲存格範圍,準則): 計算範圍內符合準則之個數,準則可以是數字、示式、儲存格參照或文字字串。例如:60、">60"、表B8或者"華碩"。 Step1.假設調查班上50位同學所使用之筆記型電腦品牌 Step2.打開「2.4.1次數分配表」 華碩 聯想 宏碁 技嘉 惠普
(表)完成後之次數分配表 品牌 華碩 宏碁 惠普 聯想 技嘉 次數 10 15 13 8 4
2.4.2相對次數分配表 所謂相對次數分配表即把次數分配表中每個欄位次數除以全部資料筆數即可求出相對次數
Excel指令說明 COUNTA(範圍):計算範圍內非空白的儲存格個數。 &:文字連接符號 "/":輸出 / 符號 打開「2.4.2相對次數分配表」 (表)完成後之相對次數分配表 品牌 華碩 宏碁 惠普 聯想 技嘉 相對次數 0.2 0.3 0.26 0.16 0.08 品牌 華碩 宏碁 惠普 聯想 技嘉 相對次數 10/50 15/50 13/50 8/50 4/50
打開「2.4.2相對次數分配表」 (表)完成後之相對次數分配表 品牌 華碩 宏碁 惠普 聯想 技嘉 相對次數 0.2 0.3 0.26 0.16 0.08 品牌 華碩 宏碁 惠普 聯想 技嘉 相對次數 10/50 15/50 13/50 8/50 4/50
2-5 定量資料常用的統計表 定量資料的整理依照是否進行分組,可分成組距型與非組距型 組距型資料 非組距型資料 是指資料整理時,有進行分組 將蒐集到的資料進行排序之後再計算次數
2.5.1次數分配表 非組距型資料的次數分配表 打開檔案「2-5-1非組距型次數分配表」 (表)某班級50位學生的年齡資料 19 20 21 22 23
(表)利用Excel樞紐分析表,完成後的表 年齡 19 20 21 22 23 次數 17 8 6 2
組距型資料的次數分配表 組距型的資料在製作次數分配表前必須先決定組距與組數 一般大都先決定組數,把組數控制在某個範圍內,再根據組數決定組距
打開檔案:「2-5-1組距型次數分配表」 (表)某班級學生某次考試統計學成績 (表)完成後的次數分配表 分數 10-19 20-29 68 60 70 17 72 54 52 64 75 82 69 76 49 62 78 88 48 14 66 80 83 37 41 74 27 53 65 87 96 71 61 56 45 (表)完成後的次數分配表 分數 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 次數 5 1 22 14 9 2
2.5.2相對次數分配表 Excel指令說明 COUNT(範圍):計算範圍含有數字的儲存格個數。 打開檔案「2-5-2相對次數分配表」 (表)完成後的表 分數 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 相對次數 0.078125 0.015625 0.34375 0.21875 0.140625 0.03125 分數 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 相對次數 5/64 1/64 22/64 14/64 9/64 2/64
2.5.3累積次數分配表 是指將資料的次數,依照資料大小由小到大或者由大到小依序累加來所得到的統計表 故累積次數分配表有以下累積次數分配表與以上累積次數分配表兩種
以下累積次數分配表 資料由小到大排序後,再將各組次數進行累加所得之統計表 打開檔案「2-5-3以下累積次數分配表」 (表)完成後之表格 分數 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 次數 5 1 22 14 9 2 累積次數 6 7 12 17 39 53 62 64
以上累積次數分配表 將資料由大到小排序,然後再將各組次數累加 打開檔案「2-5-3以上累積次數分配表」 (表)完成後之表格 分數 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 次數 5 1 22 14 9 2 累積次數 64 59 58 57 52 47 25 11
2-6 定性資料常用的統計圖 定性資料常用的統計圖有長條圖、折線圖與圓面積圖
2.6.1長條圖 也有人稱為條形圖或直條圖,長條圖是以橫座標為類別變數,縱座標為次數,並以適當的寬度劃上彼此不相連接的矩型 Step1.打開檔案「2-6-1長條圖」 品牌 華碩 宏碁 惠普 聯想 技嘉 次數 10 15 13 8 4
Step2. 完成後之長條圖
2.6.2折線圖 以橫座標為類別變數,縱座標為次數,以座標的方式標示在直角座標平面上,然後再依序將這些座標點用線段連接起來所成的圖形 Step1.打開檔案「2-6-1長條圖」
Step2. 完成後之折線圖
2.6.3圓面積圖 也有人稱為圓餅圖或圓形圖,圓面積圖的製作時必須先求出每個類別在全體所佔的比率再換算成圓心角後,才能順利的繪製出來 Step1.打開檔案「2-6-1長條圖」
Step2. 完成後之圓形圖
2-7 定量資料常用的統計圖 定量資料常用的統計圖有直方圖與折線圖 折線圖又分成次數折線圖以及累積次數折線圖
2.7.1直方圖 每一組組距當成寬度,對應的次數當成高度,依序將每一組資料以相互連接在一起的矩形所形成的圖形 打開檔案「2-7-1直方圖」 分數 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 次數 5 1 22 14 9 2
完成後之直方圖
2.7.2折線圖 組距型資料則以每一組的組中點當成橫座標,次數當成縱座標,再用線段依序將這些點連接而成 製作折線圖時,資料輸入需要兩個欄位,分別為每一組的組中點以及對應的次數
檔案2-7-2折線圖 分數 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 次數 22 14 9 2 完成後的折線圖