SPSS軟體與迴歸分析 南台科技大學企管系 呂金河
壹、相關係數 例如 1. 經理想了解產品價格與銷售量是否有相關? 2. 教育學者想了解 IQ成績與教學成績是否有相關? 1. 經理想了解產品價格與銷售量是否有相關? 2. 教育學者想了解 IQ成績與教學成績是否有相關? 3.醫生想了解人出生時的體重與壽命是否有相關? 4. 房地產公司想了解房價與物價是否有相關?
相關係數計算方法的選擇 Y X 名目尺度 順序尺度 量度尺度 ψ相關 列聯相關係數 Cramer’s V係數 卡方檢定 點二系列相關 多系列相關 Spearman等級相關Kendall等級相關 Pearson積差相關
註: 1.ψ相關(適用於兩變數都是二分)、列聯相關、Cramer’s V係數、等級相關、Kendall和諧係數,值在0與1之間。其餘在-1與 1之間。 2.Pearson積差相關、點二系列相關、Kendall等級相關、Spearman等級相關由 相關雙變數 在對話框勾選 3.ψ相關、列聯相關係數、Cramer’s V係數、卡方檢定的各種相關係數由敘述統計 交叉表 在對話框勾選 4. Kendall和諧係數在分析無母數檢定 K個相關樣本勾選Kendall W檢定
連續變數間的相關係數常用Pearson 相關係數描述,次序型變數的相關係數常用Spearman秩相關係數描述, Pearson r= -1≦r≦1,r=1時,x 與y成一斜率為正的直線,稱為完全正相關; r= -1時,x 與y成一斜率為負的直線,稱為完全負相關。 r > 0 表 x 值增加時,y值有增加的傾向; r < 0 表 x值增加時,y 值有減少的傾向。 r = 0 表x 與y 無線性相關,x 與y可能有U形曲線相關
變數間有〝相關〞不一定有〝因果關係〞 SPSS操作:點選分析相關雙變數,將要計算的變數移至變數欄,在相關係數欄勾選Pearson,在選項(options)欄勾選統計量下的均值與標準差及交叉乘積與共變異按繼續按OK。
貳、迴歸分析 目的:找出一個線性方程式,用來說明一組預測變數( Xi )與效標變數( Y )的關係。目的在探求Y與Xi的關係式
§1迴歸分析的步驟 1.選定反應變數(Y)與解釋變數 ,(複)線性迴歸模式為 且互相獨立 其中,α與β為迴歸母數(i=1, 2, ……, n),ε為誤差項。 在迴歸分析中,如果預測變數(Xi)只有一個,則稱之為簡單迴歸分析。如果預測變數有二個以上,則稱為多元迴歸或複迴歸分析。
資料格式
選擇重要自變數 (用逐步迴歸法) 估計 的值,並對每一個βi 檢定βi=0 否 (t檢定) (各別邊際檢定) 在ANOVA表上,檢定 否 (總檢定,F檢定) ,以瞭解整體關係是否達到顯著水準 用調整後判定係數 (>0.18) 判定模式合格否 (配適度) 用判定係數 判定總變異被迴歸解釋的百分比,以瞭解這個方程式的預測能力如何。
殘差分析,檢查 是否滿足 (1)常態性 (用Wilk-Shapiro W檢定或常態機率圖), (2)變異數恆常性(用ei對Xk的殘差圖,或ei2對每一Xk作迴歸,看β1 =0否), (3)獨立性(用Durbin-Watson檢定,D-W值介在1.5至2.5表示無自我相關)等三個假設條件 若殘差分析證明模式不合適,可能需做變數轉換,去除離群值,增減變數等以修正模式 模式解釋
§2 迴歸分析SPSS操作法 l.Step1:點選分析 歸迴方法 線性 3,Step3:進入"統計量"。點選"模式適合度"、"R平方改變量"及"Durbin- Watson",以判定模型的有效性及誤差之間的線性關係,並點選"繼續" 4.Step4:進入"統計圖"。將"DEPENDENT(依變數)"與"ZRESID(標準化的殘差值)" 這兩個選項分別拖曳至X軸與Y軸,作殘差分析表,並點選"繼續" 5.Step5: 按"確定",開始執行。 6.迴歸SPSS報表分析
§3.複迴歸SPSS報表分析 例:想了解大學入學考試的數學成績(x1)與英文成績(x2)對大一微積分成績(y)的影響有多高,試作迴歸分析 86 學生 數學成績 英文成績 大一微積分 序號 x1 x2 y 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 52 43 65 36 51 38 54 29 24 23 72 78 45 41 39 71 88 48 49 59 44 57 92 64 55 58 63 76 85 84 86 74 77 73
判定係數R2=0.64 ,判定總變異被迴歸解釋的百分比有64%,表示迴歸方程式的預測能力良好。 調整後判定係數 adj R2=0.597 (>0.18) ,表示判定模式良好。 Durbin-Watson檢定,D-W值=3.177不介在1.5至2.5,表示殘差有輕微無自我相關。
在ANOVA表上,F檢定的p值=0. 002<0 在ANOVA表上,F檢定的p值=0.002<0.05,拒絕 ,表示總體而言,數學成績(x1)與英文成績(x2)對大一微積分成績影響顯著。
檢定 βi=0否的t檢定的p值<0.05的只有數學,表示各別而言,數學成績(x1)對大一微積分成績影響顯著。而英文成績(x2)對大一微積分成績影響不顯著。廻歸係數的信賴區間,英文成績的信賴區間包含0,亦表示英文成績(x2)對大一微積分成績影響約為0,不顯著。 估計的迴歸模式為 大一微積分成績=50.559+0.357*數學成績+0.163*英文成績
標準化殘差的常態機率圖略呈直線,表示殘差 滿足常態性
標準化殘差對預測值的散佈圖呈隨機散布的長條狀,表示變異數恆常性成立且因其殘差隨機散布,獨立性似亦成立
§4 羅吉斯迴歸(logistic regression) 目的:估計二元因變數 (或多項因變數) 與自變數的關係式,可用以預測因變數的值 (做分類)及建模 二元變數,設 ”成功 ” 機率為p,”失敗 ” (最後一類) 機率為1-p,模式為 利用逐步迴歸選取重要的自變數 估計 的值,並對每一βi檢定 βi=0 否 (Wald檢定) 用適合度χ2 檢定,判定模式的解釋能力合格否 (檢定 ) 5. 預測 值,並可由 值判定Y歸成功 或失敗類
例: Y = 偏好品牌,X1=性別、X2=職業 為自變數做logistic迴歸,以預測偏好品牌 SPSS操作: 點選分析 迴歸方法 二元logistic 在對話框將偏好口味移至依變量,性別、職業移至共變量 若點選方法的向前Wald、向後LR、等,則可做逐步選擇重要自變數 按類別,將性別、職業移至類別共變量 繼續 按儲存,勾選預測值及殘差等 繼續 按選項,勾選分類圖、Hosmer-Lemeshow適合度、等 繼續 確定
§5 Probit 分析 目的:估計二元因變數 (或多項因變數) 與自變數的關係式,可用以預測因變數的值 (做分類)及建模 二元變數,設 ”成功 ” 機率為p,”失敗 ” (最後一類) 機率為1-p,模式為 其中Φ為標準常態分配的CDF 利用逐步迴歸選取重要的自變數 估計 的值,並對每一βi檢定 βi=0 否 (Wald檢定) 用適合度χ2 檢定,判定模式的解釋能力合格否 (檢定 ) 5. 預測 值,並可由 值判定Y歸成功 或失敗類
例 研究殺蟲劑的藥效得實驗資料如右,試找出一個適當的配適迴歸模式 例 研究殺蟲劑的藥效得實驗資料如右,試找出一個適當的配適迴歸模式 SPSS操作: 點選分析 迴歸方法 probit分析 在對話框將兩個變數移至反應變數(成功次數)與觀察值總和,將自變數移至因子或共變量 若有需要可點選共變量的轉換,轉換共變量x成log(x)或ln(x) 勾選probit 分析或logit分析 確定 殺蟲劑用量(dose) 實驗蟲數(total) 毒死蟲數(dies) 2.65 51 7 3.87 49 15 5.41 46 25 7.87 48 40 10.28 50 43