第二部份 SPSS操作程序與方法 資料處理與數據查核
閱讀範圍 邱皓政著 量化研究與統計分析 陳景堂著 統計分析SPSS for Windows入門與應用 Chapter 4 原始資料的電腦化 邱皓政著 量化研究與統計分析 Chapter 4 原始資料的電腦化 Chapter 6 SPSS統計軟體之運用 Chapter 7 資料的描述與呈現 陳景堂著 統計分析SPSS for Windows入門與應用 SPSS使用 (Chapter 2~4) 資料的轉換 (Chapter 7) 資料描述、統計量數 (Chapter 6、8)
1. 原始資料的電腦化 Computerized Raw Data
課程目標 了解資料電腦化的一般原則 了解編碼系統與編碼表的功能與內容 了解並能操作文字資料的計量處理 了解廢卷處理的概念與程序 了解資料輸入的方法與程序 了解特殊題型的處理方式
原始資料的電腦化 原始資料(raw data): 反應受測者在問卷實際填答情形的資料型態 編碼或過錄(coding): 紙本原始資料(raw data on paper) 電腦化原始資料(computerized raw data) 編碼或過錄(coding): 由紙本原始資料轉換成電腦化原始資料的過程 編碼與工具發展應同步進行 編碼是一套資料處理之模式包含 資料架構(framework):資料格式、符號特徵、內容廣度、遺漏處理 處理流程(procedure) :資料分類、轉換、合併、刪除
資料的基本類型
文字資料的編碼與過錄 步驟一:依編碼系統進行分類與計量 步驟二:以虛擬化變項(dummy variable)方式,進行資料備整 虛擬化:資料收集完成後,以人為方式進行資料整理賦予數量符號之過程 如將文字轉為數字:將每個類別賦予一個特定數字,如宗教信仰的調查,將天主教賦予1、基督教賦予2、道教賦予3等 虛擬化的問題 解釋上的困難:數字本身未具有特定數學邏輯與概念意義 編碼的繁複性與主觀性 分析方法的問題
編碼簿(Codebook) 目的:記錄資料數量化之所有格式與內容,詳述資料處理步驟。 功能 內容 SPSS可利用公用程式來確認編碼表 提供標準化的作業流程 溝通的功能 工作憑據的建立與工作記憶的留存 內容 變項名稱與標籤(說明用) 變項數值與標籤(說明用) 遺漏值處理 SPSS可利用公用程式來確認編碼表
題號順序 變項的名稱、數值內容與標籤 遺漏值處理方式
廢卷處理 回收控制與登錄 遺漏與補漏處理 不良答題型態的處理 反應心向的處理
原始資料的電腦處理 純文字資料檔(ASCII files) 視窗環境的資料輸入 SPSS軟體的使用 直接輸入法 間接輸入法 轉檔功能的使用 編輯功能的使用 類別變項的加權輸入模式
ASCII檔案型態
SPSS資料視窗
資料電腦化的處理原則 資料輸入以編碼系統為依歸 充分的訓練 良好的作業環境與流程安排 資料保密工作的落實 工作記憶的保留
上機練習 1 . SPSS使用練習 (陳景堂著 課本第二章) 2 .資料定義與輸入練習 (陳景堂著 課本第三、四章)
特殊題型之處理程序-複選題 1. 資料輸入(以個別題目型態輸入) 2. 定義集群 3. 完成虛擬複選題變項 4. 次數分配表分析 點選統計分析→複選題分析→定義集合 定義集內的變數 3. 完成虛擬複選題變項 4. 次數分配表分析 5. 交叉表分析
【例】下列為了解青少年人際網路與影響力之題組 Q1: 長期影響最深的是 同性同學 異性朋友 兄弟姐妹 父母 老師 Q2: 目前對您影響最大的是 Q3: 對您最了解的是 Q4: 遇到身心問題可以訴說的對象 Q5: 重大人生決定可能討論之對象 複選變相矩陣型態資料 題數 同性同學 異性朋友 兄弟姐妹 父母 老師 Q1 (長期影響) Q11 Q12 Q13 Q14 Q15 Q2 (目前影響) Q21 Q22 Q23 Q24 Q25 Q3 (貼心了解) Q31 Q32 Q33 Q34 Q35 Q4 (身心問題) Q41 Q42 Q43 Q44 Q45 Q5 (重大決定) Q51 Q52 Q53 Q54 Q55
複選題分析對話框1 需先行定義集合才會浮現次數分配與交叉表之功能
複選題分析對話框2 每個選項只有被選與不選兩種可能,將被選紀錄為1,不選紀錄為 0
複選題分析:次數分配表結果輸出 反應百分比 人次百分比
特殊題型之處理程序-排序題 1. 資料輸入(以個別題目型態輸入) 2. 定義集群 3. 完成虛擬複選題變項 點選統計分析→複選題分析→定義集合 定義集內的變數(定義時需依不同的順位進行多次的集內變數定義) 3. 完成虛擬複選題變項 4. 分析:針對不同順位虛擬變數進行次數分配表分析或交叉表分析
【例】下列為了解青少年使用網路工具之偏好排名,為一種排序題 Q1: 請問在下列網路工具選項中,指出三種您最常使用與朋友溝通之工具,並依程度標出1、2、3的順序 (1為最常使用者) ICQ CICQ Email MSN BBS 聊天室 WWW Netmeeting 相關對應表格如下: ID Gender Q1A ICQ Q1B CICQ Q1C Email Q1D MSN Q1E BBS Q1F 聊天室 Q1G WWW Q1H Net-meeting 1 2(女) 2 3 1(男) 4 5
排序題定義對話框
排序題分析: 次數分配表結果輸出 Group $ Order 1 第一順位
排序題分析: 交叉表結果輸出
上機練習 1. 複選題練習 2. 特殊題型排序題練習
Usage of the SPSS software
SPSS程式的基本操作流程 一、資料定義(data definition) 使電腦能夠正確的辨認量化的數據,並對於數據賦予正確的意義。 變項名稱指定(變項標籤)、變項數值的標籤、變項的格式類型、遺漏值的設定。 資料定義必需與編碼表配合,將適當的變項名稱與數據的意義加以標註,並設定適當的遺漏值,方能使後續的資料處理與分析能夠正確有效的進行。
標籤註記指令範例與說明
SPSS程式的基本操作流程 二、資料轉換(data transformation) 進行資料分析前的一些校正與轉換的工作 如反向題的反向計分,出生年月變項轉變成年齡之新變項的創造。 廢卷處理、資料備便、遺漏值的補漏檢查等作業,也是在此一階段進行。SPSS軟體提供的觀察值選擇、重新編組或四則運算等指令,皆能協助轉換工作的進行。 一旦轉換完成後,此一資料庫已可稱為乾淨的(clean and clear)的資料。
資料轉換指令 量化研究的資料處理包括多種的資料整理的程序,例如COMPUTE、COUNT、 RECODE、 RANK、 SORT、SAMPLE、N等。
四則(邏輯)運算指令COMPUTE 提供使用者將資料進行各種邏輯運算處理 四則運算的表現則依一般數學關係式的模式(先乘除後加減),可配合函數來進行運算。 語法為 COMPUTE 新變項=原有變項之四則運算
四則運算指令語法與範例
Recode RECODE(轉換)指令的用途非常廣,可以將變項的數值進行各種轉換。如反向題轉換、分組類別的調整。 語法如下: 範例: RECODE X2 (1=5)(2=4)(4=2)(5=1). 反向題轉換 RECODE X2 X8 X12 X25 (1=5)(2=4)(4=2)(5=1).(若有多題類似情形時) RECODE EDU (1=1)(2=2)(3=3)(4=3)(5=4)(6=4).(教育程度重新分組) VALUE LABELS EDU 1”國小及以下” 2 “國中” 3 “高中職” 4 大學及以上”.
COUNT(計數) 語法如下 COUNT 新變項=舊變項名 (某數值) COUNT Y=I1 TO I10 (4) 計算受訪者在十題回答非常滿意的次數,放入新變項Y) COUNT Z=I1 TO I10 (lowest thru 2) 計算受訪者在十題回答不滿意與非常 不滿意的次數,放入新變項Z) COUNT MISS=I1 TO I10 (MISSING) 計算受訪者在十題回答遺漏的次數放入MISS新變項)
條件化邏輯指令 IF、PROCESS IF、SELECT IF 在限定特定條件下,來進行新變項的創造 IF指令為一般性條件指令,只有符合括弧內條件關係的情形下,才會執行後方的四則運算式。 語法如下: IF (條件式) 新變項=邏輯運算 範例: IF ((A+B) LT 100) P=1. (當A+B大於10時,新變項P為1) IF (SYSMIS(GENDER)) S=0. (當GENDER為遺漏值時,S為0) IF (CITY=”TPE” AND GROUP=1) K=1. (CITY為字串變項)
邏輯運算子之縮寫與範例說明
PROCESS IF 與 SELECT IF 條件式 動作式 PROCESS IF 與 SELECT IF則是條件化的條件化指令。也就是在IF條件式的功能下,附加對於IF指令的操作條件。 PROCESS IF對於資料的限定化處理是暫時性的,SELECT IF對於資料的限定化處理是永久性的。 完整的PROCESS IF與SELECT IF指令應包含兩行指令, 條件式 動作式 每一筆資料經過PROCESS IF的二行指令處理完成後,才進行其他的指令。 語法如下: PROCESS IF (條件式).
條件化指令語法與範例
RANK 語法如下 RANK指令能將某一個變項的數值,產生等級、百分等級、常態分數等類型的分數。 RANK 變項 /RANK INTO 新變項名 (產生等級變數於新變項) /NTILES(組數) INTO 新變項名 (產生百分等級) /NORMAL INTO 新變項名 (產生常態等級) /RFRACTION INTO 新變項名 (產生比率等級) /SAVAGE INTO 新變項名 (產生指數分數)
SAMPLE與N SAMPLE的功能在從資料庫中隨機抽取一定比率的樣本,而N指令則是抽取特定位置的樣本。 語法如下: SAMPLE 百分比. SAMPLE 樣本數 FROM 總筆數 N n 範例: SAMPLE .25. (隨機取用某百分之25之樣本) SAMPLE 500 FROM 5000 (自總筆數5000當中隨機抽取500筆資料) N 100 (抽取前100筆資料作為樣本)
資料轉換指令語法與範例說明
上機練習 資料的轉換練習 (陳景堂課本第七章)
SPSS程式的基本操作流程 三、資料分析(data analysis) 依操作者的指令,進行各種的統計分析或統計圖表的製作。 操作者必須具備良好的統計基本知識,才能在數十種統計指令當中選擇適合的統計方法來分析資料。 操作者必須能夠閱讀分析之後的報表數據,從不同的指數與指標當,尋求關鍵且正確的數據來作為研究報告撰寫的根據。
Description and Graphing of the Data 3. 資料的呈現與描述 Description and Graphing of the Data
社會科學研究: 資料處理的角色與內容 研究計劃: 方法設計與執行 資料分析前置作業流程 資料的統計分析與報告 工具發展 問卷與編碼表 資料輸入 電腦化原始資料 (.sav) 資料查核 資料轉換 語法檔.sps (資料定義與轉換) 備便資料檔.sav 資料呈現描述 結果輸出檔 .spo 資料的統計分析與報告
資料呈現與描述 資料呈現: 摘要統計: 運用次數分配來整理並描繪變數數值分佈情形 利用統計圖表來表現出數據的特性與分佈情形 次數分配表 次數分配圖 利用統計圖表來表現出數據的特性與分佈情形 摘要統計: 透過描述統計的統計量運算,建立初步的統計指標,作為後續統計分析的基礎。
類別資料的次數分配表 類別資料由於缺乏計量單位數值的種類較少,最適合使用次數分配表
連續變項的次數分配表 連續資料通常需要先計算全距再決定組數與組距,並定義各組上下限 程度測量的次數分配表
類別資料的次數分配圖 長條圖
連續資料的次數分配圖 直方圖
莖葉圖(Stem-and-Leaf Plot) 普林斯頓大學John Tukey教授於1977年所發展一種用以描述觀察值的簡便方法,可以快速的以人工將觀察值進行劃記,並以圖表的方式呈現出來,兼具次數分配表與長條圖的雙重優點。 莖葉圖最適合二位數資料之呈現,如考試成績 莖葉圖製作係將每個觀察值切割為莖葉兩部份,中間以垂直線隔開。莖為觀察值中間十位數或以上之數字業則為個位數的數字。
莖的部份 葉的部份 莖葉圖範例
描述統計: 集中趨勢量數 基本概念 常用的集中量數 描述測量觀察值集中情形 為數據建立一個能夠描述其共同落點的最佳指標 常用的集中量數 眾數 (mode):一組數中出現最多的數 中數(median):一組數中出現在最中間的數 平均數 (mean) :將一變項中所有數值之總和除以總資料數所地之結果
集中量數之測量特性與比較
描述統計: 離散量數 基本概念 常用的離散量數 描述測量觀察值分散狀況的情形 為數據建立數據分佈廣度的指標 常用的離散量數 全距 (Range): 一組數中最大值與最小值之差,為一群數分離程度最粗略之指標 四分差:將資料由小至大排列後,依資料數平均分為四段,則每段各佔25%之個數,位居三個分段點之分數稱為第一四分位數、第二四分位數、第三四分位數 變異數 (variable): 將資料值減去平均數後,求平方和後,在將加總後之數值除以人數。 標準差 (standard deviation) : 變異數 之平方根
離散量數之測量特性與比較
描述統計: 偏態與峰度 負偏態 (左偏) 正偏態(右偏) 常態 高狹峰 低闊峰 常態峰
偏態與峰度係數的計算
偏態與峰度係數的判斷
描述統計: 標準分數(Z score) 標準分數 將變項變量以原始平均數與標準差進行數學轉換得出一個平均數為零,標準差為1的變量 標準分數為去單位化之分數,可以反應出原始數值的方向與分散情形,並作跨分配的比較。 Z分數: 原始分數減去其平均數,再除以標準差後所得到的新分數。
常態曲線的特徵 (normality) 1. 對稱性 (symmetry) 2. 單峰分配 (unimodal) 3. 平均數、眾數、中數落於分配的中心點 4. 具有機率分配的機本特質
上機練習 1 .資料描述、統計量數 (課本第六章、第八章) 次數分配表之製作 點選 分析 → 敘述性統計 → 次數分配表 莖葉圖之製作 1 .資料描述、統計量數 (課本第六章、第八章) 次數分配表之製作 點選 分析 → 敘述性統計 → 次數分配表 莖葉圖之製作 點選 分析 → 敘述性統計 → 預檢資料
第一次作業(陳景堂) 1 . 課本第三章(p.3-9)、第5小題 2 . 課本第四章(p.4-38)、第1小題