第 8 章 計量與質性預測變數之迴歸模型
8.1 多項式迴歸模型 多項式迴歸模型的使用 單一預測變數的第二階模型 多項式迴歸模型可以包含一、二或更多個預測變數,並且每一個預測變數可以有多種不同的乘冪,我們先從具有第一、二階乘冪的單一預測變數之多項式迴歸模型開始: (8.1) 其中,
由於上面的多項式迴歸模型只有一個預測變數,但 是模型中有第一與第二階乘冪項,所以稱為單一預 測變數的第二階模型 多項式迴歸模型的迴歸係數經常會出現些微不 同的形式,主要是在反應指數的型態,在此採用的 形式為: (8.2) 迴歸模型(8.2)之反應函數為: (8.3) 此一反應函數為一個拋物線,習慣上稱為二次反應 函數
說明 2.第二階多項式迴歸模型(8.2)的最小平方標準方程式為: 從(6.77),將 代替 、 代替 ,同時 ,於是可以得到其代數式: (8.4)
單一預測變數的第三階模型 考慮下面的迴歸模型: (8.5) 其中, 稱為單一預測變數的第三階模型,迴歸模型(8.5)之反應函數為: (8.6) 單一預測變數的更高階模型 雙預測變數的第二階模型
考慮下面的迴歸模型: (8.7) 其中 稱為雙預測變數的第二階模型,迴歸模型之反應函 數為: (8.8) 它是一個圓錐切面方程式,在迴歸模型(8.7)中包含 了每一個預測變數的線性、二次式與一個雙預測變 數的交叉乘積項,該交叉乘積項代表了這兩個預測 變數的交互作用,而係數 稱為交互作用係數。
三預測變數的第二階模型 考慮下面的迴歸模型: (8.9) 其中 稱為三預測變數的第二階模型,迴歸模型之反應函數為: (8.10) 係數 、 、 稱為成對預測變數之交互作用係數。
多項式迴歸模型的實作 配適多項式模型 階層式模型配適法 以X表示的迴歸函數 當多項式迴歸模型產生後,通常我們會考慮使用 原始變數,而非置中後的變數,例如以置中變數 表示配適的單預測變數第二階模型: (8.11) 用原始變數表示為: (8.12)
其中, (8.12a) (8.12b) (8.12c) 個案實例 案例介紹 這位研究人員不能確定在各因子的研究範圍內,反應函數的性質,因此他先配適了一個第二階多項式迴歸模型(8.7): (8.13) 而其反應函數為: (8.14)
為了顧及X1與X2所取水準之平衡性,研究人員將預 為方便比較的單位: (8.15) 配適模型 從迴歸係數的估計值可以得到估計的迴歸函數為: (8.16) 殘差圖
配適度檢定 複判定係數 部份F檢定 第一階模型 基於上面的種種分析,研究人員現在決定下面的第一階模型: (8.17) 模型配適後所得到的估計反應函數為: (8.18)
以X表示所配適的第一階模型 配適的第一階迴歸函數(8.18)可以利用(8.15)轉回原始預測變數,結果為: (8.19) 迴歸係數的估計 多項式迴歸模型的進一步評論 有時配適二次反應函數的本意就是為了當沒有重複觀測值可用時,可以直接進行線性反應函數的檢驗,以便確定線性反應函數的合理性,不過配適二次模型: (8.20) 並檢定,其結果仍然不能確定線性反應函數適當
8.2 交互作用迴歸模型 交互作用效應 一個含有(p - 1)個預測變數的迴歸模型,若其反應變數可以表示成: (8.21) 線性效應之迴歸模型交互作用之解釋 迴歸係數的解釋 計量的雙預測變數X1與X2對於反應變數Y之影響為線性時,且X1與X2對於Y具有交互作用效應,其模型如下: (8.22)
我們可以推導出當X2固定時,X1每增加一單位,平 均反應的改變量為: (8.23) 類似的情形,當X1固定時,X2每增加一單位,平均反 應的改變量為: (8.24) 一個預測變數的效應如何與另一個預測變數有關係。 在此案例中,市場銷售量(Y,萬元)對於銷售點的促 銷支出(X1,千元)與電視廣告支出(X2,千元)的 反應函數(6.3)是具有相加性的: (8.25)
接下來我們來看圖8.7b,它在原來的反應函數中增 加了一個交叉乘積項 .5 ,該交叉乘積項的意義 代表了兩個預測變數對市場銷售量的交互作用,反 應函數為: (8.26) 假如迴歸模型(8.26)中, , (8.27) 它代表的意義將是兩個預測變數之交互作用造成電 視廣告支出高檔時,促銷活動每增加一單位,可以 產生的效應比低檔時可以產生的效應小
反應函數的形狀 曲線效應之迴歸模型交互作用之解釋 迴歸模型交互作用的實作
8.3 質性預測變數 二類別的質性預測變數 在保險新制的案例中,質性預測變數分成兩類,假設我們定義X2與X3如下: (8.30) 而第一階模型為: (8.31)
解決此問題的一個簡單辦法就是剔除一個指標變數,在這裡我們剔除X3,注意剔除一個指標變數並非解決此問題的唯一辦法,不過這種方法使得參數的解釋簡單多了。一般採用如下原則: 具有c種類別的質性變數可以用c - 1個指標變 數表示,每一個指標變數均採用0與1的值。 (8.32) 迴歸係數之解釋 在保險新制的案例中,剔除迴歸模型(8.31)中的指標變數X3後,迴歸模型成為: (8.33)
其中, 該迴歸模型之反應函數為: (8.34) 接下來解釋迴歸模型中之係數的意義。首先對於公 司類別為合作社的情形,X2 = 0,所以反應函數 (8.34)成為: 合作社 (8.34a) 對於公司類別為股份公司的情形,X2 = 1,所以反 應函數(8.34)成為: 股份公司 (8.34b)
超過二類別的質性預測變數 當質性預測變數之分類超過兩種時,則需要在迴歸模型中增加指標變數。下面的例子是關於工具耐用度Y對於工具速度X1與工具樣式的迴歸分析,其中工具樣式是一個四種分類(M1、M2、M3、M4)的質性預測變數,所以需要三個指標變數,指標變數之定義如下: (8.35)
第一階模型 第一階迴歸模型如下: (8.36) 迴歸模型(8.36)之反應函數為: (8.37) 關於模型中迴歸係數之意義,我們先考慮工具樣式 為M4時的反應函數,亦即X2 = X3 = X4 = 0時的反應 函數: 工具樣式M4 (8.37a) 同理當X2= 1, X3 = X4 = 0時,代表工具樣式為M1的 反應函數: 工具樣式M1 (8.37b)
類似的情形,代表工具樣式為M2、M3的反應函數分別 為: 工具樣式M2 (8.37c) 工具樣式M3 (8.37d) 經由反應函數(8.37c)與(8.37d)可以知道的點估計量為, 而此估計量之變異數為: (8.38)
時間數列應用 指標變數在時間數列資料中的迴歸分析,經常是很有用的工具。例如儲蓄Y對所得X所進行的迴歸分析,其中儲蓄與所得都是連續多年的年度資料,可能考慮模型為: (8.39) 其中Yt與Xt分別代表的儲蓄與所得。假設資料使用期間涵蓋了平時與戰時,由於戰時可能有較高之儲蓄傾向,因此可以利用下面的迴歸模型: (8.40) 其中,
如果每季的銷貨量會受到季別的影響,則合併季節 影響效應之第一階迴歸模型為: (8.41) 其中,
8.4 使用指標變數之考慮 指標變數與配置碼 配置碼可以是任意的數值,在上例中假設沒有其他的預測變數,則使用配置碼的第一階迴歸模型為: (8.42) 指標變數對於分組的間距並沒有任何假設前提,完全是依據資料間的差別效應,則第一階迴歸模型為: (8.43)
此處 的意義在於衡量差別效應: 而 的意義在於衡量差別效應: 指標變數與計量變數 指標變數的其它編碼法 第一種編碼方式為: (8.44)
其第一階線性迴歸模型為: (8.45) 具有反應函數: (8.46) 此一反應函數依照不同的公司類別,可以拆開為: (8.46a) (8.46b) 第二種編碼方式為去掉迴歸模型的截距項,然後對c 種類別的質性變數,分別用編碼值0與1的方法來定義不同的類別,在前面的保險新制案例中,模型為: (8.47)
其中, 而兩個反應函數分別為: (8.48a) (8.48b)
8.5 計量與質性預測變數之交互作用 公司規模與公司類別很可能有交互作用的存在,雖然模型中有一個質性的預測變數,交互作用項仍然可以跟過去相同,利用交叉乘積項的形式引進模型中,本案例中含有交互作用的第一階迴歸模型為: (8.49) 其中, 而反應函數為: (8.50)
迴歸係數之意義 首先在合作社的部份,由於 = 0,所以 = 0,因此合作社下的反應函數(8.50)成為: (8.50a) 其次,在股份公司方面,因為 = 1,所以 = ,因此在股份公司下的反應函數(8.50)成為: 或是: (8.50b)
8.6 更為複雜之模型 質性預測變數多於一個 考慮廣告支出Y對銷售量X1、公司類型(有限公司、非有限公司)、業務管理品質(高、低),定義質性預測變數如下: (8.51) 第一階模型 上例中的第一階迴歸模型為: (8.52)
加入交互作用後的第一階模型 在上面的廣告支出案例中,第一階迴歸模型如果增加了兩兩預測變數的交互作用項,模型成為: (8.53) 僅有質性預測變數 迴歸模型也允許僅含有質性之預測變數。在上面的廣告支出案例中,廣告支出可以只針對公司類型與管理品質進行迴歸分析。第一階迴歸模型為: (8.54)
8.7 兩個或兩個以上迴歸函數之比較
肥皂生產線案例 暫時性模型 此模型假設了碎屑量Y與生產線速率X1的迴歸關係,在兩條生產線上的表現均為直線,且有相同的誤差項變異數,僅可能有不同的迴歸斜率與截距。 (8.55) 其中, 診斷
對兩條迴歸直線的推論 兩條生產線之迴歸函數是否相同的問題,可以考慮下面的假設檢定: (8.56) 適當的檢定統計量為(7.27): (8.56a) 其中n為兩母體之樣本合併後之個案數,利用表8.6之結果:
其次,分析人員想知道兩條生產線之迴歸函數是否 有相同的直線斜率,可以考慮下面的假設檢定: (8.57) 適當的檢定統計量為(7.25)的t*統計量或是(7.24)的 部份F*統計量: (8.57a) 利用表8.6以及部份F*統計量之結果:
儀器測定案例 兩套儀器的迴歸函數可能不同,因此採用下面的模型 (8.58) 其中, 對於儀器A而言,X2 = 0,反應函數為: 儀器A (8.59a)
對於儀器B而言,X2 = 1,反應函數為: 儀器B (8.59b) 因此檢定兩個反應函數是否相等,所涉及之假說為: (8.60) 適當的檢定統計量為(7.27): (8.60a) 其中n為兩母體之樣本合併後之樣本大小。