Ch12 資料分析
資料編輯 Editing 資料編輯目的: 正確性 一致性 完整性 簡化編碼
資料編碼 Coding 資料編碼原則: 適切性:有效分類 周延性:避免「其他」選擇 戶斥性:避免兩個以上答案 單一構面:避免雙重構面問項
編碼表 Codebook
封閉式問題編碼 婚姻狀況: (選填數字) 已婚 喪偶 離婚 分居 未婚
開放式問題編碼 內容分析 Content Analysis 例:如何改善員工關係? 應負責單位 曾提及 未提及 1. 管理階層 2. 工會 3. 未加入工會員工 4. 管理階層與工會間 5. 管理階層與員工間 6. 其他
描述統計 集中趨勢:均值,中位數,眾數 離散程度:變異數,標準差,全距,四分位距 四分位差 形狀衡量:偏態,峰態
資料顯示與檢驗 資料視覺圖像化 探索式資料分析:調查 確認式資料分析:檢驗
探索式資料分析 次數分配表 長條圖 圓餅圖 直方圖 箱形圖 資料轉換
次數分配表 Frequency Table
長條圖 Bar Chart
圓餅圖 Pie Chart 高精準度
直方圖 Histogram 適於區間與比例尺度資料 表示所有分配區間 描述變數分配情形
箱形圖 Box-&-Whisker Plot 五項(抗拒型)統計值摘要顯示: 中位數 上、下四分位數 最大、最小值 非抗拒型統計量: 平均數 標準差
資料轉換 標準常態: Z=Xi-X/s 非線性轉換: 資料分群(10個以上) 計算各群體之中位數與四分位差對數值 迴歸分析估計迴歸參數(即斜率) P=1-斜率,即為轉換之冪次方
改善控制分析 SPC 統計製程管制 柏拉圖 (Pareto Diagram)
統計製程管制 Statistical Process Control
柏拉圖 Pareto Disgram 80/20 法則
交叉列聯表 Cross-Tabulation 分析兩個名目變數分配關係 卡方檢定兩變數分配之獨立性