第十四章 複相關與複迴歸分析 陳順宇 教授 成功大學統計系
第十二章兩因子變異數分析是討論 〝兩因一果〞 基本上兩個因是分類的離散型變數, 上一章簡單線性迴歸是探討 〝一因一果〞 (都是計量的連續型變數), 很自然地,也會想到連續型的多因單果問題。
變異數分析與迴歸分析 都是討論因果關係, 相同的是”果”都是連續型的計量資料 不同的是變異數分析”因”是離散型資料, 但迴歸所談的”因”是連續型資料
因果關係列表
14.1 複相關係數 簡單相關係數是討論一個準則變數與 一個預測變數之間的關聯,
複相關 但如果預測變數有好幾個變數時, 如何量測準則變數與這組預測變數之間的關聯性有多高呢? 當預測變數有多個時,量測準則變數y與預測變數x1,...,xp之間的相關稱為複相關
例14.1、想了解大學入學考試的 數學成績(x1)與英文成績(x2)對 大一微積分成績(y)的影響有多高
第一種想法: 先計算相關再求平均 x1, y的相關係數r1=0.7611 x2 , y的相關係數r2=0.5661 再算此兩相關係數的平均值為0.6636
第二種想法是: 先求平均再計算相關
入學考試英數與大一微積分成績
大學入學考試英數平均成績與 大一微積分成績的相關係數為 r =0.7801
一般的加權平均
15.2 複迴歸分析簡介 複迴歸分析是探討變數之間的關係式, 我們將變數分成兩類, 一類是自變數 一類是應變數 15.2 複迴歸分析簡介 複迴歸分析是探討變數之間的關係式, 我們將變數分成兩類, 一類是自變數 一類是應變數 複迴歸是探討自變數有兩個或以上時, 自變數如何影響應變數的問題
複迴歸模式
最小平方法
正規方程式
迴歸式公式
14.3 各種方法計算複迴歸的係數 介紹四種方法求迴歸係數bi的估計值。
表14.3 15名學生成績八行合計
1. 解正規方程式
迴歸式
以公式求bi估計
3.以電腦軟體
表14.4 大一微積分成績對聯考數學、英文成績複迴歸擬合值與殘差值 表14.4 大一微積分成績對聯考數學、英文成績複迴歸擬合值與殘差值
檢定
在ANOVA表中P值 = 0.0022, 表示入學考試數學英文成績對微積分 有顯著影響, 這是說這兩科成績中 至少有一科對微積分有影響, 但並不表示這兩科都對微積分有影響
檢定
參數估計表中P值 = 0.0068 < 0.05 也就是既使已有英文成績, 數學成績仍對微積分有影響
檢定
P 值 = 0.1822, 檢定是不顯著的, 它的意思是如果模式中 已有入學考試數學成績, 就不需要再用到英文成績了 但並不表示英文成績與微積分成績無關, 事實上他們之間的相關係數是0.5661
判定係數
入學考試成績(數學、英文)與微積分的複相關係數
例14.2、房子坪數受收入, 人口數與家長教育程度的影響
(a)檢定全部三個自變數是否對 y 有預測能力?即檢定
表示這三個自變數組合對y預測有貢獻,但並不表示每一個自變數都有預測能力
擬合值與殘差值
y對x1,x2的迴歸式
14.4 複迴歸預測
例14.3、(14.2續) 試求收入103萬、人口數3人、大學畢業的家庭之房子坪數y 95%信賴區間與預測區間?
信賴區間與預測區間
14.5 多項式迴歸
例14.4、速度x與耗油量y的關係
圖14.1 汽車耗油量y對車速x的散佈圖
線性迴歸
由 P值=0.1826或 由=0.0870 都顯示線性迴歸不佳
圖14.2 汽車耗油量y對車速x的線性迴歸殘差圖
二次迴歸
圖14.3 汽車耗油量y 對車速x的二次迴歸式殘差圖
第十四章 摘要
1. 了解複相關係數的意義是 求兩組變數之間的(線性)相關性, 其中一組只有一個變數, 而另一組有多個變數
2. 學習以最小平方法 求複迴歸係數的參數估計
3.介紹求解迴歸式的各種方法,包括
4.
5.
6. 知道如何由複迴歸式做預測
7. 學習多項式迴歸的使用, 並了解多項式次數愈高, 則擬合程度愈好(愈大), 但付出的代價是模式愈複雜, 且解釋愈困難