第二部份 SPSS操作程序與方法 資料處理與數據查核.

Slides:



Advertisements
Similar presentations
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
Advertisements

林惠玲 陳正倉著 雙葉書廊發行 2009 第 4 章 分析資料 - 以統計測量數呈現 1 統計學 方法與應用 四版上冊 第 4 章 分析資料 - 以統計測量數呈現.
第四週課程 1 (10/10~10/16) 如何建立資料. 原始資料範例 a1~a5 表示選擇題,輸入原始答案,如 A 、B、C、D b1~b5 表示填充題, c1~c5 表示計算題,輸入得分.
第一單元 建立java 程式.
單元九:單因子變異數分析.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理 與圖表編製。.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理與圖表編製。.
實驗規劃--實驗因子設定, 效標選定與受測者選定
Ch12 資料分析.
項目分析與信度估計 (Item Analysis and Reliability Estimation )
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
二、以圖表描述資料 2. Charts & Graphs.
量化研究與統計分析 Data Graphing 國立臺灣體育運動大學 高明峰
參考書籍:林惠玲與陳正倉(2002),應用統計學(第二版)。台北:雙葉書廊有限公司。
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
17 類別資料的分析  學習目的.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
陳維魁 博士 儒林圖書公司 第九章 資料抽象化 陳維魁 博士 儒林圖書公司.
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
量化研究與統計分析 Data Graphing
Chap3 Descriptive statistics -numerical measures Minitab & Excel
主題五 CPU Learning Lab.
Excel資料庫分析 台灣微軟資深講師 王作桓.
第3章 資料的整理與表現- 統計表與統計圖.
Using EXCEL for ANOVA.
點狀圖 (Dot Plot).
第八章 利用SELECT查詢資料.
邏輯迴歸 Logistic Regression
類別(class) 類別class與物件object.
SQL Stored Procedure SQL 預存程序.
ASP.NET基本設計與操作 建國科技大學 資管系 饒瑞佶 2007年.
安裝JDK 安裝Eclipse Eclipse 中文化
介紹SPSS SPSS 本為 Statistical Package for the Social Sciences 的簡寫,由於產品及功能不斷地擴充,目前改名成 Statistical Product and Service Solutions。
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
第四章 原始資料的電腦化 Computerized Raw Data.
網路安全技術 OSI七層 學生:A 郭瀝婷 指導教授:梁明章.
第一章 敘述統計學 1.1 原始資料 1.2 統計表 1.3 統計圖 1.4 統計量值 一些經驗法則 44 ©2009 陳欣得
第一單元 建立java 程式.
VS.NET 2003 IDE.
第二次電腦實習課 說明者:吳東陽 2003/10/07.
小學數學科 二年級課程 — 統計圖 製作 — 麥頌儀老師 (青山天主教小學上午校).
輸入&輸出 函數 P20~P21.
小學四年級數學科 8.最大公因數.
信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.
期末考.
大綱:加減法的化簡 乘除法的化簡 去括號法則 蘇奕君 台灣數位學習科技股份有限公司
Review of Statistics.
Ogive plot example 說明者:吳東陽 2003/10/10.
電子期刊使用統計 CONCERT 2002 meeting November 13-14, 2002 羅宙康 Springer-Verlag
MicroSim pspice.
班級:404班 時間:星期二第八節 教師:黃韋欽師
SQL語法教學 2015/10/15 John.
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
第七章 資料轉換和 個案選擇 7.1 前言 7.2 〝Recode〞功能 7.3 〝Compute〞功能 7.4 〝Count〞功能
第四章 統計資料的整理:統計量數.
11058: Encoding ★☆☆☆☆ 題組:Problem Set Archive with Online Judge
國立台灣大學 關懷弱勢族群電腦課程 By 資訊工程 黃振修
Quiz1 繳交期限: 9/28(四).
第一章 直角坐標系 1-3 函數及其圖形.
資料結構與C++程式設計進階 期末考 講師:林業峻 CSIE, NTU 7/ 15, 2010.
非負矩陣分解法介紹 報告者:李建德.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
描述統計 Descriptive Statistics
ABAP Basic Concept (2) 運算子 控制式與迴圈 Subroutines Event Block
Chapter 4 Multi-Threads (多執行緒).
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
ABAP Basic Concept (2) 運算子 控制式與迴圈 Subroutines Event Block
InputStreamReader Console Scanner
Presentation transcript:

第二部份 SPSS操作程序與方法 資料處理與數據查核

閱讀範圍 邱皓政著 量化研究與統計分析 陳景堂著 統計分析SPSS for Windows入門與應用 Chapter 4 原始資料的電腦化 邱皓政著 量化研究與統計分析 Chapter 4 原始資料的電腦化 Chapter 6 SPSS統計軟體之運用 Chapter 7 資料的描述與呈現 陳景堂著 統計分析SPSS for Windows入門與應用 SPSS使用 (Chapter 2~4) 資料的轉換 (Chapter 7) 資料描述、統計量數 (Chapter 6、8)

1. 原始資料的電腦化 Computerized Raw Data

課程目標 了解資料電腦化的一般原則 了解編碼系統與編碼表的功能與內容 了解並能操作文字資料的計量處理 了解廢卷處理的概念與程序 了解資料輸入的方法與程序 了解特殊題型的處理方式

原始資料的電腦化 原始資料(raw data): 反應受測者在問卷實際填答情形的資料型態 編碼或過錄(coding): 紙本原始資料(raw data on paper) 電腦化原始資料(computerized raw data) 編碼或過錄(coding): 由紙本原始資料轉換成電腦化原始資料的過程 編碼與工具發展應同步進行 編碼是一套資料處理之模式包含 資料架構(framework):資料格式、符號特徵、內容廣度、遺漏處理 處理流程(procedure) :資料分類、轉換、合併、刪除

資料的基本類型

文字資料的編碼與過錄 步驟一:依編碼系統進行分類與計量 步驟二:以虛擬化變項(dummy variable)方式,進行資料備整 虛擬化:資料收集完成後,以人為方式進行資料整理賦予數量符號之過程 如將文字轉為數字:將每個類別賦予一個特定數字,如宗教信仰的調查,將天主教賦予1、基督教賦予2、道教賦予3等 虛擬化的問題 解釋上的困難:數字本身未具有特定數學邏輯與概念意義 編碼的繁複性與主觀性 分析方法的問題

編碼簿(Codebook) 目的:記錄資料數量化之所有格式與內容,詳述資料處理步驟。 功能 內容 SPSS可利用公用程式來確認編碼表 提供標準化的作業流程 溝通的功能 工作憑據的建立與工作記憶的留存 內容 變項名稱與標籤(說明用) 變項數值與標籤(說明用) 遺漏值處理 SPSS可利用公用程式來確認編碼表

題號順序 變項的名稱、數值內容與標籤 遺漏值處理方式

廢卷處理 回收控制與登錄 遺漏與補漏處理 不良答題型態的處理 反應心向的處理

原始資料的電腦處理 純文字資料檔(ASCII files) 視窗環境的資料輸入 SPSS軟體的使用 直接輸入法 間接輸入法 轉檔功能的使用 編輯功能的使用 類別變項的加權輸入模式

ASCII檔案型態

SPSS資料視窗

資料電腦化的處理原則 資料輸入以編碼系統為依歸 充分的訓練 良好的作業環境與流程安排 資料保密工作的落實 工作記憶的保留

上機練習 1 . SPSS使用練習 (陳景堂著 課本第二章) 2 .資料定義與輸入練習 (陳景堂著 課本第三、四章)

特殊題型之處理程序-複選題 1. 資料輸入(以個別題目型態輸入) 2. 定義集群 3. 完成虛擬複選題變項 4. 次數分配表分析 點選統計分析→複選題分析→定義集合 定義集內的變數 3. 完成虛擬複選題變項 4. 次數分配表分析 5. 交叉表分析

【例】下列為了解青少年人際網路與影響力之題組 Q1: 長期影響最深的是 同性同學 異性朋友 兄弟姐妹 父母 老師 Q2: 目前對您影響最大的是 Q3: 對您最了解的是 Q4: 遇到身心問題可以訴說的對象 Q5: 重大人生決定可能討論之對象 複選變相矩陣型態資料 題數 同性同學 異性朋友 兄弟姐妹 父母 老師 Q1 (長期影響) Q11 Q12 Q13 Q14 Q15 Q2 (目前影響) Q21 Q22 Q23 Q24 Q25 Q3 (貼心了解) Q31 Q32 Q33 Q34 Q35 Q4 (身心問題) Q41 Q42 Q43 Q44 Q45 Q5 (重大決定) Q51 Q52 Q53 Q54 Q55

複選題分析對話框1 需先行定義集合才會浮現次數分配與交叉表之功能

複選題分析對話框2 每個選項只有被選與不選兩種可能,將被選紀錄為1,不選紀錄為 0

複選題分析:次數分配表結果輸出 反應百分比 人次百分比

特殊題型之處理程序-排序題 1. 資料輸入(以個別題目型態輸入) 2. 定義集群 3. 完成虛擬複選題變項 點選統計分析→複選題分析→定義集合 定義集內的變數(定義時需依不同的順位進行多次的集內變數定義) 3. 完成虛擬複選題變項 4. 分析:針對不同順位虛擬變數進行次數分配表分析或交叉表分析

【例】下列為了解青少年使用網路工具之偏好排名,為一種排序題 Q1: 請問在下列網路工具選項中,指出三種您最常使用與朋友溝通之工具,並依程度標出1、2、3的順序 (1為最常使用者)  ICQ  CICQ  Email  MSN  BBS  聊天室  WWW  Netmeeting 相關對應表格如下: ID Gender Q1A ICQ Q1B CICQ Q1C Email Q1D MSN Q1E BBS Q1F 聊天室 Q1G WWW Q1H Net-meeting 1 2(女) 2 3 1(男) 4 5

排序題定義對話框

排序題分析: 次數分配表結果輸出 Group $ Order 1 第一順位

排序題分析: 交叉表結果輸出

上機練習 1. 複選題練習 2. 特殊題型排序題練習

Usage of the SPSS software

SPSS程式的基本操作流程 一、資料定義(data definition) 使電腦能夠正確的辨認量化的數據,並對於數據賦予正確的意義。 變項名稱指定(變項標籤)、變項數值的標籤、變項的格式類型、遺漏值的設定。 資料定義必需與編碼表配合,將適當的變項名稱與數據的意義加以標註,並設定適當的遺漏值,方能使後續的資料處理與分析能夠正確有效的進行。

標籤註記指令範例與說明

SPSS程式的基本操作流程 二、資料轉換(data transformation) 進行資料分析前的一些校正與轉換的工作 如反向題的反向計分,出生年月變項轉變成年齡之新變項的創造。 廢卷處理、資料備便、遺漏值的補漏檢查等作業,也是在此一階段進行。SPSS軟體提供的觀察值選擇、重新編組或四則運算等指令,皆能協助轉換工作的進行。 一旦轉換完成後,此一資料庫已可稱為乾淨的(clean and clear)的資料。

資料轉換指令 量化研究的資料處理包括多種的資料整理的程序,例如COMPUTE、COUNT、 RECODE、 RANK、 SORT、SAMPLE、N等。

四則(邏輯)運算指令COMPUTE 提供使用者將資料進行各種邏輯運算處理 四則運算的表現則依一般數學關係式的模式(先乘除後加減),可配合函數來進行運算。 語法為 COMPUTE 新變項=原有變項之四則運算

四則運算指令語法與範例

Recode RECODE(轉換)指令的用途非常廣,可以將變項的數值進行各種轉換。如反向題轉換、分組類別的調整。 語法如下: 範例: RECODE X2 (1=5)(2=4)(4=2)(5=1). 反向題轉換 RECODE X2 X8 X12 X25 (1=5)(2=4)(4=2)(5=1).(若有多題類似情形時) RECODE EDU (1=1)(2=2)(3=3)(4=3)(5=4)(6=4).(教育程度重新分組) VALUE LABELS EDU 1”國小及以下” 2 “國中” 3 “高中職” 4 大學及以上”.

COUNT(計數) 語法如下 COUNT 新變項=舊變項名 (某數值) COUNT Y=I1 TO I10 (4) 計算受訪者在十題回答非常滿意的次數,放入新變項Y) COUNT Z=I1 TO I10 (lowest thru 2) 計算受訪者在十題回答不滿意與非常 不滿意的次數,放入新變項Z) COUNT MISS=I1 TO I10 (MISSING) 計算受訪者在十題回答遺漏的次數放入MISS新變項)

條件化邏輯指令 IF、PROCESS IF、SELECT IF 在限定特定條件下,來進行新變項的創造 IF指令為一般性條件指令,只有符合括弧內條件關係的情形下,才會執行後方的四則運算式。 語法如下: IF (條件式) 新變項=邏輯運算 範例: IF ((A+B) LT 100) P=1. (當A+B大於10時,新變項P為1) IF (SYSMIS(GENDER)) S=0. (當GENDER為遺漏值時,S為0) IF (CITY=”TPE” AND GROUP=1) K=1. (CITY為字串變項)

邏輯運算子之縮寫與範例說明

PROCESS IF 與 SELECT IF 條件式 動作式 PROCESS IF 與 SELECT IF則是條件化的條件化指令。也就是在IF條件式的功能下,附加對於IF指令的操作條件。 PROCESS IF對於資料的限定化處理是暫時性的,SELECT IF對於資料的限定化處理是永久性的。 完整的PROCESS IF與SELECT IF指令應包含兩行指令, 條件式 動作式 每一筆資料經過PROCESS IF的二行指令處理完成後,才進行其他的指令。 語法如下: PROCESS IF (條件式).

條件化指令語法與範例

RANK 語法如下 RANK指令能將某一個變項的數值,產生等級、百分等級、常態分數等類型的分數。 RANK 變項 /RANK INTO 新變項名 (產生等級變數於新變項) /NTILES(組數) INTO 新變項名 (產生百分等級) /NORMAL INTO 新變項名 (產生常態等級) /RFRACTION INTO 新變項名 (產生比率等級) /SAVAGE INTO 新變項名 (產生指數分數)

SAMPLE與N SAMPLE的功能在從資料庫中隨機抽取一定比率的樣本,而N指令則是抽取特定位置的樣本。 語法如下: SAMPLE 百分比. SAMPLE 樣本數 FROM 總筆數 N n 範例: SAMPLE .25. (隨機取用某百分之25之樣本) SAMPLE 500 FROM 5000 (自總筆數5000當中隨機抽取500筆資料) N 100 (抽取前100筆資料作為樣本)

資料轉換指令語法與範例說明

上機練習 資料的轉換練習 (陳景堂課本第七章)

SPSS程式的基本操作流程 三、資料分析(data analysis) 依操作者的指令,進行各種的統計分析或統計圖表的製作。 操作者必須具備良好的統計基本知識,才能在數十種統計指令當中選擇適合的統計方法來分析資料。 操作者必須能夠閱讀分析之後的報表數據,從不同的指數與指標當,尋求關鍵且正確的數據來作為研究報告撰寫的根據。

Description and Graphing of the Data 3. 資料的呈現與描述 Description and Graphing of the Data

社會科學研究: 資料處理的角色與內容 研究計劃: 方法設計與執行 資料分析前置作業流程 資料的統計分析與報告 工具發展 問卷與編碼表 資料輸入 電腦化原始資料 (.sav) 資料查核 資料轉換 語法檔.sps (資料定義與轉換) 備便資料檔.sav 資料呈現描述 結果輸出檔 .spo 資料的統計分析與報告

資料呈現與描述 資料呈現: 摘要統計: 運用次數分配來整理並描繪變數數值分佈情形 利用統計圖表來表現出數據的特性與分佈情形 次數分配表 次數分配圖 利用統計圖表來表現出數據的特性與分佈情形 摘要統計: 透過描述統計的統計量運算,建立初步的統計指標,作為後續統計分析的基礎。

類別資料的次數分配表 類別資料由於缺乏計量單位數值的種類較少,最適合使用次數分配表

連續變項的次數分配表 連續資料通常需要先計算全距再決定組數與組距,並定義各組上下限 程度測量的次數分配表

類別資料的次數分配圖 長條圖

連續資料的次數分配圖 直方圖

莖葉圖(Stem-and-Leaf Plot) 普林斯頓大學John Tukey教授於1977年所發展一種用以描述觀察值的簡便方法,可以快速的以人工將觀察值進行劃記,並以圖表的方式呈現出來,兼具次數分配表與長條圖的雙重優點。 莖葉圖最適合二位數資料之呈現,如考試成績 莖葉圖製作係將每個觀察值切割為莖葉兩部份,中間以垂直線隔開。莖為觀察值中間十位數或以上之數字業則為個位數的數字。

莖的部份 葉的部份 莖葉圖範例

描述統計: 集中趨勢量數 基本概念 常用的集中量數 描述測量觀察值集中情形 為數據建立一個能夠描述其共同落點的最佳指標  常用的集中量數 眾數 (mode):一組數中出現最多的數 中數(median):一組數中出現在最中間的數 平均數 (mean) :將一變項中所有數值之總和除以總資料數所地之結果

集中量數之測量特性與比較

描述統計: 離散量數 基本概念 常用的離散量數 描述測量觀察值分散狀況的情形 為數據建立數據分佈廣度的指標  常用的離散量數 全距 (Range): 一組數中最大值與最小值之差,為一群數分離程度最粗略之指標 四分差:將資料由小至大排列後,依資料數平均分為四段,則每段各佔25%之個數,位居三個分段點之分數稱為第一四分位數、第二四分位數、第三四分位數 變異數 (variable): 將資料值減去平均數後,求平方和後,在將加總後之數值除以人數。 標準差 (standard deviation) : 變異數 之平方根

離散量數之測量特性與比較

描述統計: 偏態與峰度 負偏態 (左偏) 正偏態(右偏) 常態 高狹峰 低闊峰 常態峰

偏態與峰度係數的計算

偏態與峰度係數的判斷

描述統計: 標準分數(Z score) 標準分數 將變項變量以原始平均數與標準差進行數學轉換得出一個平均數為零,標準差為1的變量 標準分數為去單位化之分數,可以反應出原始數值的方向與分散情形,並作跨分配的比較。  Z分數: 原始分數減去其平均數,再除以標準差後所得到的新分數。 

常態曲線的特徵 (normality) 1. 對稱性 (symmetry) 2. 單峰分配 (unimodal) 3.    平均數、眾數、中數落於分配的中心點 4.    具有機率分配的機本特質

上機練習 1 .資料描述、統計量數 (課本第六章、第八章) 次數分配表之製作 點選 分析 → 敘述性統計 → 次數分配表 莖葉圖之製作 1 .資料描述、統計量數 (課本第六章、第八章) 次數分配表之製作 點選 分析 → 敘述性統計 → 次數分配表 莖葉圖之製作 點選 分析 → 敘述性統計 → 預檢資料

第一次作業(陳景堂) 1 . 課本第三章(p.3-9)、第5小題 2 . 課本第四章(p.4-38)、第1小題