第15章 羅吉斯與Probit迴歸分析 本章的學習主題 1.羅吉斯迴歸分析的概念 2.羅吉斯迴歸的假設 3.Logit 轉換 4.羅吉斯迴歸報表分析 5.Probit 迴歸分析 企業研究方法 第 15 章
15.1 羅吉斯迴歸的概念 羅吉斯迴歸類似線性迴歸模式。迴歸分析是描述一個依變數與一個或多個預測變數之間的關係,然而一般迴歸分析時,依變數與自變數通常均為連續變數,但羅吉斯迴歸所探討結果的依變數是離散型,特別是其分類只有二類(例如“是與否”、“同意與不同意”、“成功與失敗”)時。 利用羅吉斯迴歸的目的是在於建立一個最精簡和最能配適(fit)的分析結果,而且在實用上合理的模式,建立模式後可用來預測依變數與一組預測變數之間的關係。 企業研究方法 第 15 章
羅吉斯迴歸曲線 a b 0.5 成功 (1) 失敗 (0) c 成功與否(Y) 溫度(壓力)(X) 實際觀察值 ….…..…..…….…………………. . . . . . . . . . . .. . . . . . . ......… . . . . . ..…….…. . . … …………….…. 圖 15 – 1 羅吉斯分析的概念 企業研究方法 第 15 章
15.2 羅吉斯迴歸的假設 羅吉斯迴歸的基本假設與其他多變量分析之假設不同,因為它不需要假設分配類型,在羅吉斯分配中,自變數對於依變數之影響方式是以指數的方式來變動,即。此意味著羅吉斯迴歸無需具有符合常態分配的假設,但是如果預測變數為常態分配的話,結果會比較可靠。在羅吉斯迴歸分析中,自變數可以是類別變數(category variable),也可以是連續變數。 企業研究方法 第 15 章
15.3 羅吉斯迴歸模式 令p表示某種事件成功的機率,它受因素x的影響,即p與x之關係如下: 稱之為羅吉斯迴歸模式。 15.3 羅吉斯迴歸模式 令p表示某種事件成功的機率,它受因素x的影響,即p與x之關係如下: 稱之為羅吉斯迴歸模式。 企業研究方法 第 15 章
15.4 羅吉斯迴歸分析的評估 下表是收集125位年齡從21歲到69歲成年人的資料,研究年齡X與是否患 15.4 羅吉斯迴歸分析的評估 下表是收集125位年齡從21歲到69歲成年人的資料,研究年齡X與是否患 心臟病(Y=0表未患心臟病,Y=1表患心臟病)的關係。並依表15 - 1繪出Y 對X的散佈情形,如圖 15 – 2 所示。 表 15 -1 年齡 (X) 與罹患心臟病 (Y) 之關係表 X Y 21 0 22 0 23 0 24 0 24 1 25 0 26 0 26 0 27 0 27 1 28 0 29 1 30 0 31 0 31 1 32 0 33 0 34 0 34 1 35 0 36 0 36 1 37 1 37 0 38 1 39 0 39 1 40 0 40 1 41 1 42 0 42 1 43 0 43 1 44 0 44 1 45 0 46 0 47 0 47 1 48 1 48 0 49 1 54 0 54 1 55 1 56 0 56 1 57 0 57 1 58 0 58 1 59 1 59 0 60 0 60 1 61 1 61 1 62 0 62 1 63 1 64 1 64 1 65 1 65 0 66 1 67 1 67 1 68 1 68 1 69 1 企業研究方法 第 15 章
圖 15-2 年齡 (X) 與罹患心臟病 (Y) 之關係圖 Y與X的相關係數為0.4641。 Y對X的簡單迴歸式為:Y = -0.268 + 0.01524 X R2=0.168 企業研究方法 第 15 章
當以羅吉斯迴歸作為考量,則設年齡X與患心臟病機率的關係式為: 經過羅吉斯轉換: 則此時與X呈線性關係,即可進行羅吉斯迴歸分析。 本範例經由羅吉斯分析所得之結果分析如下: -2 Log Likelihood Goodness of Fit 147.970 123.712 Cox & Snell –R^2 Nagelkerke – R^2 .164 .221 企業研究方法 第 15 章
表 15-3 年齡 (X) 與罹患心臟病 (Y) 之羅吉斯模型檢定 Chi-Square df Significance Model 22.418 1 0.000 Block Step 表 15-4 年齡 (X) 與罹患心臟病 (Y) 之羅吉斯迴歸係數 Variable B S.E. Wald df Sig R Exp (B) 年齡 0.0712 0.0165 18.5247 1 0.0000 0.3114 1.0737 Constant -3.6064 0.8071 19.9648 企業研究方法 第 15 章
企業研究方法 第 15 章
根據表15─4,我們可以求得羅吉斯迴歸的方程式為: 假設病患年齡為31歲,以X=31代入羅吉斯迴歸式中,可得知其患有心臟病機率為: 故判斷年齡X=31的病患有心臟病之機率為19.79%。 企業研究方法 第 15 章
也就說年齡未超過50.65歲者其患有心臟病的比例小於0.5。反之超過50.65歲者其罹患心臟病之比例將大於0.5。 若欲使π>0.5,則: 解X可得:X>50.65 也就說年齡未超過50.65歲者其患有心臟病的比例小於0.5。反之超過50.65歲者其罹患心臟病之比例將大於0.5。 企業研究方法 第 15 章
表 15—5 各構面與知識管理績效之羅吉斯迴歸分析 表 15—5 各構面與知識管理績效之羅吉斯迴歸分析 知識管理績效 Model 1 Model 2 Model 3 Model 4 Model 5 Model 6 Model 7 顧客資本(ic_cf) 0.685* 0.604* 0.749** 0.697* 人力資本(ic_hf) 1.854*** 1.980*** 1.932*** 2.154*** 結構資本之交易成本導向(ic_sf1) -0.476 -0.297 -0.489* -0.212 結構資本之創新運作導向(ic_sf2) 0.520 0.642 0.487 0.480 社會資本之信任關係(scf1) 0.329 0.303 0.193 0.400 社會資本之互惠關係(scf2) 0.250 -0.683* 0.088 -0.852* 社會資本之互動關係(scf3) 0.235 0.019 0.280 -0.121 集權化(oomf1) 0.218*** -0.073 0.173* -0.086 正式化(oomf2) -0.152** -0.070 -0.097 社會化(kcpf1) -0.126 外部化(kcpf2) 0.237 連 結(kcpf3) -0.030 內部化(kcpf4) 0.423 Chi-Square 131.857 17.192 21.712 112.068 128.032 22.463 113.494 P- value 0.000 0.001 企業研究方法 第 15 章
15.5 Probit 迴歸模式 Probit迴歸分析與羅吉斯迴歸分析最大的不同點,在於在Probit 迴歸分析中依變數不再是二元變數(即0與1),而是介於0到1 之百分比變數。Probit迴歸分析時,與前節在羅吉斯分析時所導 出之模式相同。 即成功的機率: 則失敗機率為: 故優勢比(odd ratio)為: 企業研究方法 第 15 章
表15-6是研究者利用A,B,C三種減肥藥來分別給受測者服用,期間服用藥的濃度,服用週數,觀測數及有效數各不相同,假設這些數據符合Probit迴歸模式,即代表下式: Probit (有效比率)= b0+b1 × 藥的濃度+b2 × 服用週數 我們接著進行Probit模式之假設: H0:Probit模式配適度(Goodness of fit)佳 H1:Probit模式配適度(Goodness of fit)不佳 企業研究方法 第 15 章
表 15-5 各構面與知識管理績效之羅吉斯迴歸分析 表 15-5 各構面與知識管理績效之羅吉斯迴歸分析 依變數 自變數 知識管理績效 Model 1 Model 2 Model 3 Model 4 Model 5 Model 6 Model 7 顧客資本 (ic_cf) 0.685* 0.604* 0.749** 0.697* 人力資本 (ic_hf) 1.854*** 1.980*** 1.932*** 2.154*** 結構資本之交易成本導向(ic_sf1) -0.476 -0.297 -0.489* -0.212 結構資本之創新成本導向(ic_sf2) 0.520 0.642 0.487 0.480 社會資本之信任關係(scf1) 0.329 0.303 0.193 0.400 社會資本之互惠關係(scf2) 0.250 -0.683* 0.088 -0.852* 社會資本之互動關係(scf3) 0.235 0.019 0.280 -0.121 集權化(oomf1) 0.218*** -0.073 0.173* -0.086 正式化(oomf2) 0.152** -0.070 -0.097 社會化(kcpf1) -0.126 外部化(kcpf2) 0.237 連結(kcpg3) -0.030 內部化(kcpf4) 0.423 Chi-Square 131.857 17.192 21.712 112.068 128.032 22.463 113.494 P-value 0.000 0.001 註: “ * ” 表示 p<0.05;” ** “ 表示p<0.01;” *** “ 表示p<0.001 企業研究方法 第 15 章
註:「有效數」係指服用後減少體重至少達5公斤以上的個數 表 15-6 影響減肥藥效果之研究表 藥的種類 藥的濃度 服用週數 觀測數 有效數 1 A 減肥藥 10.23 4 50 44 2 7.76 3 49 42 5.13 46 24 3.80 48 16 5 2.57 6 B 減肥藥 50.12 7 40.74 47 8 30.20 9 20.42 34 10 10.00 18 11 C 減肥藥 25.12 12 43 13 15.14 38 14 27 註:「有效數」係指服用後減少體重至少達5公斤以上的個數 企業研究方法 第 15 章
進行Probit迴歸分析時,要注意各自變數若不是常態分析時,必須進行轉換。例如將表15-6資料進行Probit分析時,結果如下: 模型的適合度檢定: Goodness-of-Fit卡方值為27.098已達非常顯著的水準,因此我們拒絕虛無假設H0,即表示模式之適合度有問題,資料必須進行轉換之後再試。 Pearson Goodness-of-Fit Chi Square=27.098 DF=9 P=0.001 Parallelism Test Chi Square=17.304 DF=2 P=0.000 企業研究方法 第 15 章
從圖15-3可發現,減肥藥的濃度與減肥有效度在圖形中呈現對數的關係,因此,我們必須將藥的濃度進行對數轉換之後,才能繼續進行 Probit分析。 有效數 藥的濃度 50 30 10 20 40 60 圖15-3 藥的濃度與有效數間之關係圖 企業研究方法 第 15 章
15.6 Probit 迴歸分析的評估 表 15-7 影響減肥藥效果之研究表 ( 對數轉換要的濃度 ) 藥的種類 對數 (藥的濃度) 服用週數 觀測數 有效數 1 A 減肥藥 2.33 4 50 44 2 2.05 3 49 42 1.64 46 24 1.34 48 16 5 0.94 6 B 減肥藥 3.91 7 3.71 47 8 3.41 9 3.02 34 10 2.30 18 11 C 減肥藥 3.22 12 43 13 2.72 38 14 27 表15-7為經過轉換後的資料,而以下我們將有三個準則來判別 Probit分析的結果,分別是(1)模式的適合度檢定、(2)平行性檢定、(3)模式係數的檢定。 企業研究方法 第 15 章
表 15-8 Probit 分析表 這三個減肥藥的Probit模式分別為: 自變數 Beta 係數 標準差 t 值 ( 常數項 b0 ) A 減肥藥 B 減肥藥 C 減肥藥 -2.58097 -4.07659 -3.48698 0.30625 0.73971 0.60185 -8.42770 -5.51105 -5.79372 對數濃度 (b1) 服用週數 (b2) 1.54739 0.05717 0.35100 0.13048 4.40847 0.43816 模式配適度卡方值 7.546 模式配適度 P 值 0.580 平行性檢定卡方值 3.583 平行性檢定 P 值 0.167 這三個減肥藥的Probit模式分別為: 1.A減肥藥 Probit (有效比率)=-2.58097 +1.54739 × log (藥的濃度)+0.05717 × 服用週數 2.B減肥藥 Probit (有效比率)=-4.07659 +1.54739 × log (藥的濃度)+0.05717 × 服用週數 3.C減肥藥 Probit (有效比率)=-3.48698 +1.54739 × log (藥的濃度)+0.05717 × 服用週數 企業研究方法 第 15 章
15.7 Probit 預測分析 表 15-9 Probit預測分析表 藥的 種類 對數 濃度 Number of Subjects Obsrved Responses Expected Responses Residual Prob A 2.33 50.0 44.0 44.746 -.746 .89492 2.05 49.0 42.0 38.082 3.918 .77718 1.64 46.0 24.0 25.347 -1.347 .55103 1.34 48.0 16.0 16.662 -.662 .34712 .94 6.0 7.124 -1.124 .14248 B 3.91 47.428 .572 .98808 3.71 47.0 48.721 -1.721 .97442 3.41 45.636 1.364 .93134 3.02 34.0 36.548 -2.548 .76142 2.30 18.0 15.485 2.515 .32261 C 3.22 48.129 -.129 .96258 43.0 42.386 .614 .92144 2.72 38.0 39.081 -1.081 .81419 27.0 26.400 .600 .57392 企業研究方法 第 15 章