第 五 章 複迴歸分析.

Slides:



Advertisements
Similar presentations
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
Advertisements

變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
第 6 章 複迴歸之一.
單元九:單因子變異數分析.
第5章 增值税的其他筹划策略 主 讲 人:张 睿
實驗規劃--實驗因子設定, 效標選定與受測者選定
Chapter 2 簡單迴歸模型.
數據挖掘 課程 王海 深圳國泰安教育技術股份有限公司.
Chapter 15 複迴歸.
第16章 複迴歸.
資料分析:相關和迴歸 第十八章 「行銷研究人員必須持續檢視消費者認知和最終 購買決策之間的關係,因此,相關和迴歸技術為行
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
第 16 章 迴歸分析:模型建立.
第十四章 複相關與複迴歸分析 陳順宇 教授 成功大學統計系.
第十三章 簡單線性迴歸 陳順宇 教授 成功大學統計系.
認識倍數(一) 設計者:建功國小 盧建宏.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
Analysis of Variance 變異數分析
Chapter 2 簡單迴歸模型.
Simple Linear Regression -2
Ch7:一般線性模式 GLM.
Regression for binary outcomes
关于虚拟变量回归模型 教学目的:了解虚拟变量的含义及使用,能够应用软件进行实例模拟。 教学内容: 虚拟变量的基本含义及使用
Simple Linear Regression -4
REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
第14章 迴歸分析與複迴歸分析  本章的學習主題  1.使用迴歸分析的時機 2.最小平方法在迴歸分析上的意義 3.迴歸分析的假設
第三章 迴歸模式之評估與修訂.
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
課程九 迴歸與相關2.
邏輯迴歸 Logistic Regression
SQL Stored Procedure SQL 預存程序.
Chapter 14 Simple Linear Regression
第 7 章 複迴歸之二.
Methods 靜宜大學資工系 蔡奇偉副教授 ©2011.
第四章 相关分析与回归分析 4.1 简单相关分析 4.2 回归分析 4.3 非线性回归.
Discriminant Analysis
第 14 章 簡單線性迴歸.
第 六 章 預測變數及迴歸模型的選擇.
複迴歸分析-2 Multiple Regression.
Chapter 3 複迴歸分析: 估計.
庄文忠 副教授 世新大学行政管理学系 相关分析与简单回归分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/4/7.
複迴歸分析-1 Multiple Regression.
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第一章 直角坐標系 1-3 函數圖形.
迴歸分析 行銷、財務、人資研究.
日光燈製造業 勞工汞蒸氣暴露評估技術探討 勞工安全衛生研究所 謝俊明 林雲卿 4/18/2019.
課程十 迴歸3.
第一章.
Definition of Trace Function
第 一 章 多元迴歸分析.
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
小學四年級數學科 8.最大公因數.
第 15 章 複迴歸 © 滄海書局.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
第 5 章 簡單線性迴歸之矩陣方法.
上課大綱 迴歸係數的區間估計與假設檢定 統計顯著性與經濟顯著性 迴歸模型中的點預測與區間預測 配適度分析(變異數分析)
第一章.
Chapter 4 迴歸分析. Chapter 4 迴歸分析 迴歸分析原理 迴歸分析的目的在於找出一條最能夠代表所有觀測資料(樣本點)的函數(迴歸估計式),用這個函數代表應變數和自變數之間的關係 多變量分析—管理上的應用.
第 2 章 迴歸分析的推論.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
Linear Regression Analysis 5E Montgomery, Peck & Vining
第一章 直角坐標系 1-3 函數及其圖形.
第 1 章 單一預測變數線性迴歸.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
解下列各一元二次方程式: (1)(x+1)2=81 x+1=9 或 x+1=-9 x=8 或 x=-10 (2)(x-5)2+3=0
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第 七 章 共線性 與 偏相關.
Presentation transcript:

第 五 章 複迴歸分析

複相關係數 欲測量二組變數之間的關聯性,如果其中一組只有一個變數,另一組有二個以上的變數,則此二組變數間的相關稱為複相關。 如果二組變數都有二個以上的變數,則此二組變數間的相關稱為典型相關。

複相關係數 Yi = β0 + β1Xi1 + β2Xi2 + εi X* = aX1 + bX2,找到 X1 、X2 的線性組合與 Y 有最大的相關係數,此最大的相關係數值就稱為 X1 、X2 與 Y 的複相關係數。

複迴歸分析簡介 複迴歸分析是探討預測變數有二個以上時,預測變數如何影響準則變數的問題。 Y 對 X 的複迴歸模式如下: Yi = β0 + β1Xi1 + β2Xi2 + εi εi ~ N( 0,σ2 ),i = 1,2,…,n 模式設定後,第一件工作就是參數估計,即求參數 β0、β1、β2 的估計值,它的求法和簡單線性迴歸一樣,都是利用普通最小平方法。

各種方法求複迴歸的係數 (1)解正規方程式。 (2)以矩陣方程式估計。 (3)以另一種公式求解。 (4)以統計軟體作分析。

複迴歸模式的統計推論 複迴歸模式的一般式 Yi = β0 + β1Xi1 + β2Xi2 + … + βp-1Xi,p-1 + εi εi ~ N( 0,σ2 ) , i = 1,2,…,n 參數之估計 Y = β0 + β1Xi1 + β2Xi2 + … + βp-1Xi,p-1 ︿ ︿ ︿ ︿ ︿

偏迴歸係數的含義 β1 測量了在 X2 保持不變的情況下, X1 變動一單位所引起 Y 平均值 E(Y) 的改變量。 β1 、 β2 稱為偏迴歸係數,其意義如下: β1 測量了在 X2 保持不變的情況下, X1 變動一單位所引起 Y 平均值 E(Y) 的改變量。 β2 測量了在 X1 保持不變的情況下, X2 變動一單位所引起 Y 平均值 E(Y) 的改變量。 偏迴歸係數反映了當模型中其他解釋變數保持不變時,某個解釋變數對反應變數平均值的影響。

模式之簡化 參數的檢定:模式是否合適,除了作殘差分析的方法之外,尚須討論模式的簡化問題。 模式的簡化問題有三種情形: (1)只去除其中一個預測變數。 (2)同時去除幾個預測變數。 (3)同時去除所有的預測變數。 上述三種簡化模式的情形,都是在作統計檢定的工作。

檢定某一個預測變數的迴歸係數是否等於0 以檢定最後一個預測變數 Xp-1 作說明,即檢定 Yi = β0 + β1Xi1 + β2Xi2 + … + βp-1Xi,p-1 + εi H0: βp-1 = 0 H1: βp-1≠0 以上的假設檢定的意義為:當預測變數 X1, X2,...,Xp-2已經放入模式內時,則預測變數 Xp-1是不是可以不用再放入模式內。

檢定某一個預測變數的迴歸係數是否等於0 要作此項檢定,主要是計算 F 統計量,F 值是二個平方和作自由度調整後的比值。 首先計算簡化模式(Reduced Model)的殘差平方和SSE(R),也就是模式中未放入 Xp-1 時的殘差平方和。 其次,再計算完整模式(Full Model)的殘差平方和SSE(F),也就是模式中除了預測變數 X1, X2,...,Xp-2 外,尚包含預測變數 Xp-1 時的殘差平方和。

檢定某一個預測變數的迴歸係數是否等於0 當模式越複雜時,其 SSE 會越小,所以 SSE(F) ≦ SSE(R),而SSE(R) – SSE(F)的值越大,就表示 Xp-1 越有用(也就是 βp-1≠0,即拒絕H0)。 SSE(R) – SSE(F) 的值表示增加預測變數 Xp-1 到模式中後,Y 變異降低的部份, 以SSR(Xp-1 | X1, X2,...,Xp-2 ) 表示。

檢定某一個預測變數的迴歸係數是否等於0 到底變異要降低多少才表示預測變數 Xp-1 是有用的呢?統計學上以降低變異的比例為指標,亦即 以 [ SSE(R) – SSE(F)] / SSE(F) 作為判斷準則。此為二個平方和的比值,再作自由度的調整後,就成了 F分配。 F = [ (SSE(R) – SSE(F)) / 1 ] / [ SSE(F) / (n – p) ] 當 F > F1,n-p,α 時,拒絕 H0。 上述的 F值亦稱為偏 F 值(Partial F)。

多加一個解釋變數的貢獻

多加一個解釋變數的貢獻 P-2個

多加一個解釋變數的貢獻 P-2個

多加一個解釋變數的貢獻 P-2個

同時檢定幾個預測變數的迴歸係數是否等於0 以檢定最後 p - q 個預測變數 Xq , … , Xp-1 作說明,即檢定 Yi = β0 + β1Xi1 + β2Xi2 + … + βp-1Xi,p-1 + εi H0: βq = βq+1 = … = βp-1 = 0 H1: βi 不全為 0,i = q, q+1,...,p-1

同時檢定幾個預測變數的迴歸係數是否等於0 首先計算簡化模式(Reduced Model)的殘差平方和SSE(R),也就是模式中未放入預測變數 Xq , … , Xp-1 時的殘差平方和。 其次,再計算完整模式(Full Model)的殘差平方和SSE(F),也就是模式中除了預測變數 X1, X2,...,Xq-1 外,尚包含預測變數 Xq , … , Xp-1 時的殘差平方和。 SSE(R) = SSE(X1, X2,...,Xq-1) SSE(F) = SSE(X1, X2,...,Xp-1)

同時檢定所有預測變數的迴歸係數是否都等於0 H0: β1 = β2 = … = βp-1 = 0 H1: βi 不全為 0,i = 1, 2,,...,p-1 當模式中不放入任何預測變數時,則模式中只有常數項,因此,簡化的殘差平方和 SSE(R) = SSTO。 所以SSE(R) – SSE(F) = SSTO – SSE。 X1, X2,...,Xp-1 對 Y 有影響並不表示每一個 Xi 都對 Y有影響。

SAS報表之分析 Analysis of Variance Source DF Sum of Mean Square Square F Value Prob>F Model 3 950.16 316.72 19.11 0.0018 Error 6 99.43 16.57 C Total 9 1,049.60 H0: β1 = β2 = … = βp-1 = 0 H1:至少有一 βi 不為 0

SAS報表之分析 Root MSE 4.07091 R-square 0.9053 Dep Mean 45.20000 Adj R-sq 0.8579 C.V. 9.00644

SAS報表之分析 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob>|T| Intercept 1 17.144 7.109 2.411 0.0525 X1 1 0.129 0.058 2.211 0.0691 X2 1 4.676 1.815 2.576 0.0420 X3 1 - 0.325 0.488 - 0.667 0.5296 迴歸式: Y = 17.144 + 0.129 X1 + 4.676 X2 – 0.325 X3 ︿

檢定聯合假設 H0: β1 = β2 = … = βp-1 = 0 H1: βi 不全為 0,i = 1, 2,,...,p-1 在複迴歸模型中,一個或多個解釋變數各自對反應變數沒有影響,但聯合起來卻對反應變數有影響。 這意味著 t 檢定雖然對於檢定單個迴歸係數的統計顯著性是有效的,但對於聯合假設的檢定卻是無效的。所以對聯合假設的檢定要改用 F 檢定。

SAS報表之分析 ANOVA Table 是對整體的預測變數的預測能力作檢定。 H0: β1 = β2 = … = βp-1 = 0 H1: βi 不全為 0,i = 1, 2,,...,p-1 Parameter Estimates 則是對個別的預測變數的預測能力作檢定。 H0:β1 = 0 H0: β2 = 0 …… H0: βp-1 = 0 H1:β1 ≠ 0 H1: β2 ≠ 0 …… H1: βp-1 ≠ 0

SAS報表之分析 在Parameter Estimates中,對個別預測變數的參數作檢定,若同時有二個預測變數的 P Value 均大於0.05,則表示這二個預測變數可以從模式中刪除,但應一次刪除一個,而不是將二個同時刪除。通常以 P Value 較大者先刪除。 刪除掉一個預測變數後,需要重新跑迴歸式。

預測變數太多的困擾 對於一個準則變數,如果選用太多的預測變數,則可能會發生模式擬合得太好,出現 R2 = 1 的情形,這種情形通常發生在觀察的資料筆數 n 太少而預測變數 p 太多時。 事實上,當 p ≧ n+1 時,R2 一般都會等於 1。

預測變數取捨的依據 在模型建立過程中,要以經濟理論為依據,並充分利用以往的工作經驗。 一但建立起模型,就不要隨意地從模型中刪除某個解釋變數。