Download presentation
Presentation is loading. Please wait.
1
CHAPTER 9 量化研究Ⅳ - 資料處理與分析 -
2
本章架構圖 第一節 調查資料的接收和編輯 調查資料的編碼和輸入 調查資料的統計預處理 資料統計任務書的制製 資料處理 第四節
獨立樣本之T檢定 變異數分析 卡方檢定分析 相關分析 迴歸分析 資料分析推論統計 第二節 資料型態的種類與轉換 資料型態的呈現 常用的統計方法介紹 資料呈現的方式 第五節 預試 Excel SAS SPSS Minitab R 資料分析推論統計 第三節 問卷選項的注意事項 常用的統計表 常用的統計圖 常用的統計量數 資料分析 敘述性統 計
3
資料的處理 資料的接收和編輯 資料的編碼和輸入 資料的統計預處理 資料統計任務書的制定 資料記錄 資料檢查 資料校訂 資料編碼 資料輸入
資料檢誤 資料的編碼和輸入 資料的統計預處理 遺失值的處理 資料加權 編碼簿的編制 樣本資料結構 統計分析內容 資料統計任務書的制定
4
資料記錄(Data Recording) 在調查執行階段,應對調查結果,進行 初步的整理,其工作要點如下:
每日需回收已完成訪問的問卷資料,並記錄每天完成的問卷份數。 每份回收的問卷都需記錄完成的日期以及訪問人員的代碼,以便了解不同時間及不同人員的訪問品質。 每份問卷需設置屬於自己的識別碼號。 凡經手調查資料的人員都需詳實的記錄。
5
資料檢查(Data Checking) 對所回收的問卷進行確認與分類: 可接受的問卷 有問題的問卷 作廢的無效問卷
6
資料檢查(Data Checking) 檢查的要點如下: 問卷的受訪者需符合本次調查的篩選條件。 問卷的訪問時間是在規定的調查期程內。
問卷的內容需具備完整性,若缺失的內容是在可 容忍的範圍之外,則需要找到原本的受訪者進行 補問,否則該問卷視為無效。 回答模式需按問卷的詢問條件,即資料內容需按 問卷的設置要求。若沒有遵循問卷訪問規定的話, 須找到原本的受訪對象進行該題項的補問,否則 該問卷視為無效。
7
資料校訂(Data Editing) 工作內容-人員安排:
校訂員只負責全部問卷的某一部分內容進行校訂,此種方式對於每部分校訂的範圍較為精細可靠。 校訂員負責部份問卷的全部內容的校訂,此種方式易察覺問卷前後不一致的矛盾答案。
8
資料校訂(Data Editing) 工作內容-檢查問卷的答案 答案是否完整不遺漏? 字跡是否清晰可見?
答案是否有前後不一致的現象或者出現矛盾的地方? 開放式答案的敘述是否意義明確?
9
資料校訂(Data Editing) 工作內容-校訂過程
校訂員不可以隨意地更改答案。對於問卷上原始的答案不可以塗掉修改或者任意加上不必要的字句符號。 對於未說明或可更改範圍以外的問題時,校訂員要向負責的主管請示應如何作處理。 校訂員完成問卷校訂的工作,便應在問卷上記下名字或編號等,以便負責複核的主管進行查對的工作。
10
資料校訂(Data Editing) 工作內容-資料的處理 「空白」的處理:
對於答案出現空白的狀況時,應先探究發生的原因,若起因於調查員的疏忽所導致,則可詢問該名調查員並將答案補全。 若此時調查員已不記得答案,則可比照受訪者未作答的情形(視為「不知道」或「無答案」)或直接將該問卷作廢。
11
資料校訂(Data Editing) 工作內容-資料的處理 「不知道」的處理: 若出現不知道的答案次數不多,則可不加理會。
若出現的頻率過高時,則應該正視問題所發生的原因所在,因為極可能是由於問卷本身的設計出了問題,導致受訪者無法理解問卷的問題,故處理的方式是檢測問卷是否出現意義含糊不清的問題,或者難以理解的詞句用語。 再針對問卷重新修正,以改進問卷所發生的缺失。 若確定問卷設計上沒有發生問題,才能將不知道的答案,視為受訪者無法答覆或不願答覆來處理。 若是有辦法從問卷其他回答的資料中推測其可能的答案,則可用來取代「不知道」的回答。
12
資料校訂(Data Editing) 工作內容-資料的處理 「多項答案」的處理:
意指當面對一個問題時,受訪者可能答案不只一個;即所謂之「複選題」或是「開放題」。 依某一特定屬性的百分比來分析或者利用重複分析,將所有答案編表列示以瞭解答案的組合情形。 若是開放式作答的問題,處理的方式只要將所得的答案分門歸類即可。
13
資料檢誤(Data Cleaning) 檢核結構:檢查資料是否輸入在指定的行列位置上,以及檢視整個資料是否有輸入超過或輸入不足所要求的數量。
檢核範圍:檢查輸入的資料編碼範圍是否在規定的範圍內,例如選項只有「1」到「5」的情況,便不可能出現「6」或「6」以上的編碼範圍。 檢核邏輯:檢驗資料是否有相互矛盾的選項存在,例如依照邏輯思考,「男性」受訪者便不可能出現「懷孕」的記錄等。
14
調查資料的統計預處理 遺失值的處理 所謂「遺失值」(Missing Data)是指調查資料中,受訪者該填答之問題,未做填答。
一份調查資料若其遺失值的比例多於10%的情況下,就可能會使得該樣本資料產生推論的結果錯誤。
15
調查資料的統計預處理 資料加權 在進行資料分析之前會對樣本結果加以評估,檢視樣本結構與母群結構是否具有一致性。
符合一致性的話,則表示此調查資料具有代表性;若不符合時,則可透過加權手續讓樣本結構符合母羣結構的特質。 所謂的加權處理是指,將調查資料中每一筆資料(每位受訪者)均分別給予一個權重值,此權重值的意義是在於反映每筆資料的重要性。
16
遺失值的處理 刪除法: 將有遺失值的資料整筆刪除,此方法可能會有樣本數過少的問題。
17
遺失值的處理 成對排除法: 將有遺失值的資料保留,僅在相應的分析中將該資料排除不列入分析,故此方法在不同的分析內容中,其樣本數也不盡相同。
此方法很常被市場的研究人員採用,但需滿足三個條件, 樣本數很大 遺失值很少 變數之間的相關性不高
18
遺失值的處理 插補法 原理是將原本缺失的值補齊。 遺失值的取代方式有很多種,以下係整理一些較廣為使用的方法: 以成功樣本的平均值代入。
由統計模型計算得出該變數之期望值,取代遺失值。 選擇一個或數個與遺失值無關的變數作為分層的依據,以各分層內之成功樣本的平均值做為該層每一個遺失值的數值。
19
資料型態的分類
20
資料型態的轉換 比例尺度 區間尺度 順序尺度 區間尺度
21
各資料型態的統計量 比例尺度 區間尺度 順序尺度 名目 尺度 次數、比例、眾數 中位數、順序相關係數 平均值、變異數、標準差 相關係數、全距
倍率、增減率
22
適用的統計方法
23
不同尺度 適用的統計方法 應變數 自變數 屬質資料 屬量資料 Spearman相關 Pearson相關 卡方檢定 T檢定 迴歸分析
變異數分析
24
資料分析方法:列聯表 列聯表 Contingency Tables 列聯表的表示法 探討變數間是否有顯著關聯時用之
當資料為「屬質資料」時適用 又稱為「交叉表」(Cross-Tables) 可以清楚的陳列兩個分類變數之間的相互關係。 列聯表的表示法 觀察質表示法 期望值表示法 百分比表示法 列百分比 行百分比 總和百分比
25
資料分析方法: 次數分析表 次數分析表 Frequency Distribution Table
資料依類別或數量大小順序分成若干組,於各組內顯示其次數及百分比 適用於所有的資料
26
資料分析方法: 累積次數分析表 累積次數分析表 Cumulative Frequency Distribution Table
由次數分配表中的各組次數依序累計加總再利用各組的累積次數,編制累積次數分配表。 僅適用於屬量資料
27
統計圖-屬質資料 直條圖(Bar Chart): 圓餅圖(Pie Chart):
柱狀圖,是一種用作不同變項比較的圖表,特色在於可以區辨各個項目,並且作一相對性比較。 大致上主要的表現方式有兩種: 直條圖 橫條圖 圓餅圖(Pie Chart): 派圖,將資料數量的大小排列成圖形的一個部份,最常用來表示市場佔有率。
28
統計圖-離散型資料 點圖(Dot Chart): 線圖(Line Chart):
將資料依數字大小分類好之後,以畫點的方式呈現各組之分佈狀況 。 線圖(Line Chart): 次數分配圖,兩者都可以表示出增加或減少的絕對數量,比較的對象是前一變項。 累積次數分配圖,兩者都可以表示出增加或減少的絕對數量,比較的對象是總體變項。
29
統計圖-連續型資料 直方圖(Histogram): 多邊形圖(Polygon): 利用分組及次數(或百分比)資料
適用於資料屬連續型的變數(區間或比例尺度) 多邊形圖(Polygon): 將直方圖各長條位於橫軸上的中點亦即組中點直線相連接,即繪製成所謂的多邊形圖。
30
統計圖-連續型資料 累積次數分配圖(Cumulative Frequency Distribution):
又名肩形圖(Ogive)以累積次數或相對累積次數作圖示 分為以下累積和以上累積兩種方式。 散佈圖(Scatter Plot): 將資料繪製在兩個維度的空間上,可看出資料的散佈情形,通常用於觀察變數之間的相關性。
31
統計量數
32
資料分析方法-推論統計
33
獨立樣本T檢定 單一樣本T檢定 (One-sample T Test) 對樣本中某一變數的平均數()是否與符合母體平均數(μ)時的檢定
34
獨立樣本T檢定 兩個獨立樣本T檢定 (Independent-samples T test)
檢驗兩組資料之間的母體平均數(μ1與μ2)是否存在著差異性 兩組資料是分別來自兩個不同的母體
35
獨立樣本T檢定 成對樣本T檢定 (Paired-Sample T Test) 檢驗兩組資料之間的母體平均數(μ1與μ2)是否存在著差異性
兩組資料來自相同的母體
36
變異數分析 比較多個獨立群組「平均數」之間的變異 基本假設 單因子變異數分析 雙因子變異數分析 各組樣本的母體獨立。
各樣本的母體需服從常態分配。 各組樣本的母體變異數相同。 單因子變異數分析 雙因子變異數分析
37
卡方檢定分析 適合度檢定 (Goodness of Fit Test) 檢驗調查資料是否來自某一特定的母體分配
38
卡方檢定分析 齊一性檢定 (Test of Homogeneity) 檢定兩個或兩個以上的獨立樣本,其各類別比例是否相同的統計方法
39
卡方檢定分析 獨立性檢定 (Test of Independence) 檢測兩個類別變數之間是否有特殊的關聯
40
相關分析 衡量資料中兩個變數之間相關程度 透過相關係數了解兩變數之間的相關程度。
41
相關分析 Pearson相關分析 (Pearson Correlation Analysis)
適用於兩個變數的資料型態為「區間尺度」或「比例尺度」
42
相關分析 Spearman等級相關 (Spearman Rank-order) 適用於兩個變數都是「順序尺度」的資料
43
迴歸分析 探討一變數對另一變數的影響情形 研究和建立自變數和反應變數關係 以關係模式做為解釋及預測的工具
44
資料分析相關 之統計軟體 Excel SAS SPSS Minitab R
Similar presentations