E-mail: shlai@mail.takming.edu.tw SPSS使用與多變量統計分析 Time:8/8/2005, 8/10/2005, 8/12/2005 9:00~16:30,共18小時 Location: Trainee:對SPSS有興趣之教師或研究生 Lecturer:賴淑慧 博士 德明學院保險金融管理系副教授兼系主任 國立中央大學統計碩士 國立臺灣大學理學博士 E-mail: shlai@mail.takming.edu.tw
Referred Books SPSS統計應用實務 / 吳明隆 編著,松崗,2000 (課程用書)02-27042762 企業研究方法 / 榮泰生 編著,五南圖書,2000 (進階用書)02-27055066 研究方法 / 張紹勳 編著,滄海,2001 (進階用書)04-22588787 SPSS For Windows 統計分析 / 張紹勳等 著,松崗,2001 (工具書)02-27042762 視窗版SPSS與行為科學研究 / 王保進 編著,心理出版社,2000 (工具書)02-27069505 1. SPSS+統計分析 2. 觀念+統計分析研究方法 3. 理論+統計分析研究方法 4. 食譜式參考書:SPSS+統計分析+研究方法
Referred Internet Stations SPSS 12.0 中文版家族產品10個模組功能與相關統計方法http://www.sinter.com.tw/spss/index.htm 統計生活館http://home.kimo.com.tw/g894730/index.html
What We May Concern? 應該採用那一種統計方法來考驗研究假設? 如何使用電腦統計程序,以便正確且快速地分析研究資料? 統計程序所輸出的數據所代表的意義為何?又該如何解釋? 量化、電腦化的趨勢 先假設而後檢定, 避免誤用統計方法 蒐集大量統計資料利用電腦內的指令流程來進行統計分析 避免錯誤解釋報表
Agenda SPSS的簡介—操作介面(8/8) 問卷資料建立—問卷資料建檔、EXCEL資料讀進SPSS(8/8) 敘述統計、資料檢誤及圖表修改—基本統計繪圖、編製次數分配表及各種交叉表 (8/10) 推論統計—統計估計、假設檢定及卡方檢定(8/10) 信效度分析的理論與實務—研究設計與量表分析、項目分析、因素分析與信度考驗(8/12) SPSS主要架構的描述(GUI) 探索問題本質所採用的方法論 研究設計:實現研究目的, 回答研究問題的藍本(研究的方法、技術、程序、抽樣計劃等)
1. SPSS的簡介--1 Flow Chart of SPSS Statistical Package for the Social Science 資料檔 程式檔 結果檔 原 始 資 料 指 令 語 法 報 表 輸 出 read run ※ 將課本所附的檔案資料先COPY至硬碟中 建立SPSS可以辨識的資料檔 利用SPSS所提供之各項功能撰寫成一個程式檔(界定原始資料的位置、名稱、變項內容以及必要的資料轉換、統計分析) input output
1. SPSS的簡介--2 Windows of SPSS 應用視窗:功能表、工具列。 資料編輯視窗:用來建立原始資料檔。 結果輸出視窗:採樹狀結構的分層式報表。 SPSS資料檔副檔名為 .sav SPSS語法檔副檔名為 .sps SPSS結果檔副檔名為 .spo 1. SPSS主要視窗的介紹 2. 打開主要視窗:FileNew, Open 3. 對話方塊(來源變項清單、目標變項清單、次對話方塊、次指令)以及Paste指令的介紹
2. 問卷資料建立--1 橫列直行 每一列為來自同一個研究個體的資料 每一行為來自同一個研究變項的資料 SPSS可新建資料檔、存取檔案, 亦可讀進TXT或EXCEL資料 SPSS資料檔中含code book功能
2. 問卷資料建立--2 Numeric System: 名目(nominal)資料 順序(ordinal)資料 區間(interval)資料 比例(ratio)資料
2. 問卷資料建立--3 1.名目(nominal)資料:此種變數可做「分類」。沒有大小沒有距離。例如性別。 2.順序(ordinal)資料:此種變數可比大小及前後,但前後距離不等。只有大小沒有距離。例如5>4,但5-4≠1。例如,研究者常用Likert五點計分量表所得數據,可能是1~5分,亦可能是-2~+2分,這種資料屬於順序變數。 3.區間(interval)資料:具有前兩者的資料特性,且可以比較差距。前後距離相等,但沒有倍數關係,所以沒有絕對的0(有距離,但沒有絕對的零點)。例如5-4=1, 但4≠2×2。 4.比例(ratio)資料:具有前三者的資料特性,且可以做倍數比較。有距離,有絕對的零點。例如,4=2×2。 種族 .. 溫度 身高、體重
2. 問卷資料建立--4 Scale Design 所謂「量表化」(scaling),它是一種測量的程序,旨在將衡量對象或欲衡量的特性(property)指派某些數值,以便將測量對象之特性數值化。 衡量「變數」可用單一問項來量 衡量「構念」則要用量表來量。量表是用一個以上的指標(indicant ,item, manifested)來測量某個體/事物的特性。 「構面」即「層面」
2. 問卷資料建立--5 Likert Scale 李克特(Likert)量表是屬「評分加總式量表最常用的一種,屬同一「構念」的「這些項目」是用「加總」方式來計分,單獨或個別項目是無意義的。 「評分加總式量表」是對某一概念/構念所設計的數個項目,測量每位受訪者對它們的態度反應(同意程度)。每一個反應都給一個數值,以代表受訪者對該項目的贊同程度,將每位受訪者在這些項目的得分加總,即是受訪者對該題的態度。
2. 問卷資料建立--6 (對所要衡量之事物有利的意見) 非常同意 分數為+2 或 +5 同意 +1 或 +4 不確定 0 或 +3 非常同意 分數為+2 或 +5 同意 +1 或 +4 不確定 0 或 +3 不同意 -1 或 +2 非常不同意 -2 或 +1 (對所要衡量之事物不利的意見) 非常同意 分數為 -2 或 +1 同意 -1 或 +2 不同意 +1 或 +4 非常不同意 +2 或 +5
2. 問卷資料建立--7 加總式量表有二個假說或特徵: (1)每一個態度項目都具有相同量值,但項目之間則沒有差別量值。 (2)對同一項目而言,受訪者的反應程度是不同的(具有差別量值)。 態度項目:層面下的項目 項目:題目
2. 問卷資料建立--8 Design Step of Likert Scale: 1 建立大量有關某一「態度」構念之題庫,每一個項目(statement)等於一個項目(item),並隨機式排列這些項目。 2 邀請一組樣本,請各受訪者對上述態度各項目表達立場 3 進行項目分析:旨在對量表之題庫做篩選,它是假定每一項目都具有相同的量值。項目的好壞是依據其是否具有區別力判定,被判定為較差別力之項目,則刪除它。
2. 問卷資料建立—9 Flow Chart of Scale Construction 建立大量的題庫 是否具區別或鍵別力
3. 敘述統計、資料檢誤及圖表修改--1 敘述統計--基本統計繪圖 長條圖、餅狀圖、次數直方圖… 敘述統計--編製次數分配表 敘述統計--交叉表 資料檢誤--可利用敘述統計對資料進行初步檢誤 圖表修改--SPSS所產生的圖表格式可於SPSS中逕行修改,亦可轉貼至其他編輯軟體,如:WORD。 「copy object」 「past」 轉貼後之圖表無法再修改。
3. 敘述統計、資料檢誤及圖表修改--2 敘述統計:一般以中央趨勢量數(平均數、中位數、眾數等)及差異量數(變異數、標準差、全距等)來描述資料特性,其次亦常用統計圖表來輔助之。 次數分配(表、圖)具有下列功能: 檢測與描述資料集中的趨勢; 檢測與描述資料分散(變異)的趨勢;(Statisitcs>Summarize>Frequencies / Statistics, Charts) 檢查資料是否符合常態分配; 檢查資料是否出現極端值。(Data>Select Cases / If> Statistics>Summarize>Explore / Statistics, Plots)
3. 敘述統計、資料檢誤及圖表修改--3 相關分析:探究「單一變項」與「單一變項」間兩兩相關(變項間需均為連續變項),採「皮爾遜積差相關」,方法,如下圖所示: 一個X變項(連續變項) 一個Y變項(連續變項) 問題:學生之數學焦慮(包括底下的因素層面)、數學態度(包括底下的因素層面) 、數學投入動機(包括底下的因素層面) 、數學成就間是否有顯著的相關存在? 6-17頁~6-19頁 *相關係數 r 與決定係數 r2 或解釋變異量的比例 *有相關不一定有因果關係 散怖圖的繪製:統計圖 / 散佈圖 X Y
4. 推論統計--1 統計估計—點估計及區間估計 假設檢定 卡方檢定
4. 推論統計--2 T-test & one-way ANOVA 自變項為二分變項(包括兩個水準)-一個依變項(為連續變項) 相依樣本的T-test: 單一組別 連續變項 a1 一個連續變項 a2 前測Y1 問題:不同性別學生(兩水準)其數學焦慮、數學態度、數學投入動機與數學成就是否有顯著差異? 獨立樣本:每一個自變項均符合組間及組內獨立二個條件。 相依樣本:組內獨立,組間不獨立。同一組的前後測法,配對組法。Statistics/Compare Means/Paired-Sample T Test 7-4頁 分割點選項:將自變數分成兩個小組(水準)(通常為平均數或中位數)亦即將連續變項變成間斷變項。 統計量和樣本檢定要一起解讀。 受試者 後測Y2
4. 推論統計--3 T-test & one-way ANOVA 自變項為間斷變項(三個水準以上)- 一個依變項(為連續變項) ※ 如果自變項為連續變項,應將此連續變項化為間斷變項。 ※ 根據變異數的同質性考驗結果以及變異數分析之整體考驗的F值來決定是否進行多重事後比較(通常是需要做的)。 ※ GLM一般因子分析,可以進行單變量共變數分析,單變量的變異數分析,關連強度指數(亦即調整後的R平方)以及統計檢定力(1-β) a1 a2 、 一個連續變項 an 問題:不同家庭狀況的學生(三個水準)其數學成就、數學焦慮是否有顯著差異? ANOVA分析之F值如果達到顯著,表示組別間至少有一對平均數之間有顯著差異,但至於是那二組之間的差異,無從得知,所以要進行「成對組多從比較(多重事後比較)」(若未達顯著則不必)。 7-16頁的成對比較圖 7-17頁~21頁 7-23頁~28頁:GLM一般因子分析法 關連強度ω2與R2一樣均為自變項對依變項所能解釋的變異量。 ω2 為6%以下:自變項對依變項為微弱關係。 ω2 為6%~16%:自變項對依變項中度關係。 ω2 為16%以上:自變項對依變項強度關係。
4. 推論統計--4 Multiple Regression 多元迴歸分析法: 預測變數(N個連續變項) 效標變項(連續變項) ※ 若預測變項非連續變數,則此預測變項要化為「虛擬變項」 ※ 「逐步多元迴歸法」為多元迴歸分析法運用甚廣泛的方法之一 ※ 自變數間的「共線性」問題需接受考驗,以避免造成迴歸分析之情境困擾 X1 X2 一個依變項(Y) 、 Xn 問題:不同學生性別、數學焦慮、數學態度與數學投入動機等變項對數學成就是否有顯著預測作用、其預測力為何? 1. 逐步迴歸法:向前選擇法+向後剔除法。 2. 共線性:自變項間的相關太高,造成迴歸分析的參數無法被完全估計出來。 3. 評估共線性:容忍度(1-R2:如接近0,表示此變項幾乎是其它變項的線性組合)、變異數膨脹係數(VIF:愈大愈有共線性問題)、條件指標(CI:愈大愈有共線性問題) 4. 先呈現預測變數間的相關矩陣(積差相關),如果某些自變數間的相關係數太高,可考量只挑選其中一個較重要的變項投如多元迴歸分析。 5. 虛擬變項:8-8頁 8-9頁 Cha-7
4. 推論統計—5 Multiple Regression 區別分析法: 預測變數(N個連續變項) 效標變項(二分變項) ※ 效標變項(或稱依變項)若為一個多分變項亦適用「區別分析」 X1 y1 X2 y2 、 Xn 問題:學校組織氣氛、校長領導角色、學校組織文化,對不同學校組織效能組是否有顯著的區別作用?(學校組織效能組的區別中,如果以學校組織氣氛、校長領導角色、學校組織文化三個變項,是否可以有效加以區別呢?其區別正確率如何?) 若預測變項非連續變數,則此預測變項要化為「虛擬變項」 步驟: 根據依變項組別,自變項間有顯著的不同?(自變項<->依變項;Λ值(Wilks’ lambda)介於0至1之間,如果愈大,則表示各組平均數間愈沒有差異) 根據自變項獲取線性方程式,並從中發掘自變項對組別預測的重要程度。 線性方程式即是區別函數(min(k,p)-1) 估計每個區別函數的重要性與顯著性 決定每個自變項或預測變項的重要性 決定每個區別函數對分類組別成員的重要性 3. 根據自變項所建立的方程式來預測組別成員,並估算預測正確率多少。 14-8頁 Cha-14
4. 推論統計--6 Path Analysis 徑路分析目的為了解研究模式圖是否可以得到支持?所採用的分法為多元迴歸分析法中的「強迫進入法(Enter)」,步驟如下: 根據相關理論建構一個具因果關係研究的初始模式(徑路圖); 選用Enter法來估計逕路係數(標準化迴歸係數)並考驗其是否顯著; 重新評估與驗證。 問題:研究模式圖是否可以得到支持? 9-5頁 9-17頁 Cha-7
4. 推論統計--7 Two-way ANOVA 二因子變異數分析: 二個獨立的自變項(間斷變項) 依變項 A因子 a1(水準一) 二個獨立的自變項(間斷變項) 依變項 A因子 a1(水準一) a2(水準二) 、 一個依變項 (連續變項) 【交互作用不顯著】 問題:學生性別與其家庭狀況變項是否在數學成就變項上有顯著的交互作用? 10-2頁:圖10-1 10-3頁:表 Cha-10a 【交互作用顯著】 10-14頁 問題:不同性別與年級的學生在數學解題信念是否有顯著的交互作用? Cha-10b.sav GLM判斷有交互作用 Cha-10b.sps:MANOVA語法(無法執行,講解即可) 交互作用圖 以條件篩選進行單純主要效果比較(ANOVA) 參照附錄B, E: 問題:不同教學模式與組別學生在學習成就上是否有顯著的交互作用?(B16頁) app-g.sav E-3頁 以條件篩選進行單純主要效果比較(ANOVA):可參考附錄E B因子 b1(水準一) b2(水準二) b3(水準三) 、
4. 推論統計--8 Two-way ANOVA 二因子變異數分析流程圖:
4. 推論統計--9 Two-way ANOVA 完全隨機化2*3因子設計圖示: B因子 邊緣平均數 b1 b2 b3 A因子 a1 B因子 邊緣平均數 b1 b2 b3 A因子 a1 a1b1 a1b2 a1b3 A1 a2 a2b1 a2b2 a2b3 A2 B1 B2 B3
4. 推論統計--10 One-way MANOVA Y1 a1 a2 Y2 、 an Y3 、 YN 單因子多變量變異數分析: 一個間斷的自變項(有n個水準數) N個依變項 Y1 a1 a2 、 an Y2 Y3 問題:不同數學工作投入動機組的學生在數學態度四個層面是否有顯著的差異? 自變項要分為高(27以上1)、中(20-26之間2)、低分組(19以下3) 、 YN
4. 推論統計--11 One-way MANOVA 單因子多變量變異數分析的流程: Cha-11 11-6頁~11-15頁 11-16頁
4. 推論統計--12 Two-way MANOVA a1 Y1 a2 、 ap Y2 Y3 b1 b2 、 、 bq YN 二因子多變量變異數分析: 二個間斷的自變項(各有p, q個水準數) N個依變項 a1 a2 、 ap Y1 Y2 Y3 b1 b2 、 bq 問題:學生性別、家庭狀況在數學成就、數學焦慮、數學態度上是否有顯著的交互作用? 11-27頁 11-38頁可以試著做做看…(依變項為3個) 、 YN
4. 推論統計--13 Canonical Correlation 典型相關: M個自變項(連續變項) N個依變項(連續變項) X1 X2 X3 、 XM Y1 Y2 Y3 、 YN 問題:數學投入動機層面與數學態度層面間是否有顯著的典型相關?
4. 推論統計--14 Canonical Correlation 典型相關的結構圖如下: Y1 X1 Y2 X2 Y3 X3 1. 典型相關即在求出二個以上的X變項與二個以上Y變項的線性組合,使其簡單相關達到最大。 2. 方程式的數量=min(X變項數,Y變項數) 3. 在這些方程式中有任何顯著的關係嗎?想要了解那一個方程式有顯著性,每一個方程式關係強度如何? 4. 整體效果分析: Λ值(Wilks’ lambda) 5. 個別考驗:F值考驗 Cha-12 Y4
4. 推論統計--15 Canonical Correlation 12-15頁:表1 12-17頁:積差相關, Cha-11….
4. 推論統計--16 Cluster Analysis 特性:觀察值所屬群組特性未知的分析; 具有群組間相異,群組內同質的特性。 應用:常與區別分析(組別特性已知的驗證)一起使用。 區分: 因素分析:針對「變項」予以分組 集群分析:將「觀察值個體」予以分組 問題:以學校組織文化、學校組織氣氛、校長領導角色等變項是否可將學校分成有意義的群組? 13-6頁:Cha-13
5. 信效度分析的理論與實務--1 Method of Item Analysis 1 相關分析法:計算每一項目與總分的積差相關(以符號Rti表示),當作該題的「區別指數,區別指數偏低者,即表示該題未能區分受試者的反應程度,沒有區別效果,可予剔除。 2 內部一致性效標分析法:將所有受試者在預試量表得分的總和依高低分排序,然後由最高分者起算總人數的27%為高分組,由最低分者起算,總人數的27%為低分組。爾後以高分組受試者在某一項目(題)得分之平均數減低分組受試者在同一題得分之平均數,其差即代表此題的鑑別力。 鑑別力(Ph-Pl):值越小鑑別度越低 難度((Ph+Pl)/2):值越小題目越難 以上兩者適用在非對即錯的試題.. ※ Data:Split file, Select Cases, Sort Cases Transformation:Compute, Count, Recode
5. 信效度分析的理論與實務—2 Item Analysis 項目分析主要目的在求出問卷個別題項的決斷值—CR值:將未達顯著水準的題項刪除,其主要操作步驟如下: 量表題項的反向計分(量表中如無反向題,此步驟可以省略)。 求出量表的總分。 量表總分高低排列。 找出高低分組上下27% (or 25%)處的分數。 依臨界分數將觀察值在量表之得分分成高低二組。 以獨立樣本t-test考驗二組在每個題項的差異。 將t考驗結果未達顯著性的題項刪除。 CR:臨界值Critical Ratio ※ 1-20頁 2-2頁
5. 信效度分析的理論與實務—3 Factor Analysis— Construct Validity 效度:指一種衡量工具真正能夠測出研究人員所想要衡量之事物的程度,一般稱之為可靠性或有效性。 建構效度:指「量表能測量理論上某概念或特質的程度」,即構念是否能真實反應實際狀況。 信度過低,則沒有效度。 效度過低,則信度沒有意義。 構念即層面。 因素分析是一種利用相關係數找出一份測驗潛在共同建構(因素)之複雜統計方法。 建構效度考驗步驟包括: 建設假設性理論架構(包括建構本身及相關之理論假設)。 根據步驟一編製一份測驗,並對受試者進行施測。 以邏輯或實證之方法檢定該測驗是否能有效解釋所欲建構。
5. 信效度分析的理論與實務—4 Factor Analysis 因素分析具有簡化資料變項的功能,以較少的層面來表示原來的資料結構,亦即根據變項間彼此的相關,來找出變項間潛在的關係結構(成份或因素)。它可簡述成以下幾個步驟: 計算變項間相關矩陣或共變數矩陣 估計因素負荷量—主成份分析法(PCA) 決定轉軸方法 決定因素與命名(因素分析的目的) 共同性愈高,表示該題目與其它題目可測量的共同特質愈多。 抽取出適當數目的共同因素(common factor),原則是能保留最少的因素,但可以解釋最大的變異量。 歸納出因素下的變項,使得因素負荷量易於解釋。 檢驗是否符合理論因素,或發揮創造力來命名。 Statistics Data Reduction Factor…..點選因素分析之變項至目標清單中 Descriptive…..界定所要輸出的統計量 (相關矩陣中的相關係數大都在0.30以下或0.85以上都不好) (KMO值越接近1或 Bartlett值越顯著越適合進行因素分析) Extraction……界定因素抽取的方法 (解說總變異量和陡坡圖決定了因素的數目) Rotation………界定因素轉軸之方法 (轉軸後的因子矩陣可將各因素下的變項歸納出來,若所歸納的變項數太少則刪除該因素, 或是因子轉換矩陣中各因素間的相關係數過高時,如多在0.6以上,建議再進行二階段因素分析) Option………..界定缺失值之處理及負荷量之輸出方式 OK… Paste
5. 信效度分析的理論與實務—5 Reliability Analysis 信度:係指根據測驗工具所得到的結果之一致性或穩定度。作法為根據因素分析(Factor Analysis)的結果,針對每一個因素了解內部一致性之信度為何? 1. 信度低效度一定低,但高信度未必表示具有高效度。 2. 若同一份測驗所欲測量之行為領域愈相近,則其一致性必然愈高(此正是為何要心進行因素分析,將測量相同行為層面的題目加以歸類的原因)。 3. α係數在0.6以下則要重新檢討。 4. 先反向計分,在討論個別層面下的內部一致性,最後是總量表的內部一致性。 5. 相關係數愈高,則內部一致性愈高。 6. 該題目與分量表之相關係數(內部一致性係數)愈低,該題意可能需要修改。 7. 當刪除該題後α係數值較原來的α係數值高,表示該題目之內部一致性相對較低,可能需要刪除或修改該題目。
5. 信效度分析的理論與實務—6 Proposition & Hypothesis 命題(proposition)只是表現構念之間的關係,它仍無法驗証,研究者須將命題內各構念,選擇一個情境,將其操作化,變成知識論對應的變數( ECV) 。 「假設」(hypothesis)即為各變數(ECV)之間的對應關係,假設代表科學研究的主要工具,沒有”假設”就沒有科學的產生。假設是研究問題的暫時性答案,假設只有經過”統計檢定”後,才能判定真偽。 有一「命題」:「人群的互動與情感存在直接關係。」此命題是無法直接驗證的,所以要將命題轉成下列「假設」: 互動:ECV用「打電話次數」來衡量。 情感:ECV用「彼此擁抱次數來衡量」。 假設:「打電話次數與擁抱次數呈現正相關。」
5. 信效度分析的理論與實務—7 Research Framework 根據研究目的與相關理論,規劃一個研究之簡要架構圖。 5-23頁 6-6頁
善用工具 創造研究價值