第 6 章 複迴歸之一.

Slides:



Advertisements
Similar presentations
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
不定積分 不定積分的概念 不定積分的定義 16 不定積分的概念 16.1 不定積分的概念 以下是一些常用的積分公式。
大綱 1. 三角函數的導函數. 2. 反三角函數的導函數. 3. 對數函數的導函數. 4. 指數函數的導函數.
單元九:單因子變異數分析.
Chapter 2 簡單迴歸模型.
圓的一般式 內容說明: 由圓的標準式展出圓的一般式.
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
圓的一般式 內容說明: 由圓的標準式展出圓的一般式.
第16章 複迴歸.
資料分析:相關和迴歸 第十八章 「行銷研究人員必須持續檢視消費者認知和最終 購買決策之間的關係,因此,相關和迴歸技術為行
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
Keller: Stats for Mgmt & Econ, 7th Ed 簡單線性迴歸和相關分析
第 14 章 Logistic迴歸.
第十四章 複相關與複迴歸分析 陳順宇 教授 成功大學統計系.
第十三章 簡單線性迴歸 陳順宇 教授 成功大學統計系.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
Ch7:一般線性模式 GLM.
Simple Linear Regression -4
點狀圖 (Dot Plot).
第三章 迴歸模式之評估與修訂.
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
課程九 迴歸與相關2.
邏輯迴歸 Logistic Regression
Chapter 8 異質性.
第 14 章 簡單迴歸.
第 7 章 複迴歸之二.
單一分配 Uniform distribution
第 14 章 簡單線性迴歸.
第 六 章 預測變數及迴歸模型的選擇.
複迴歸分析-2 Multiple Regression.
Chapter 3 複迴歸分析: 估計.
複迴歸分析-1 Multiple Regression.
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第 五 章 複迴歸分析.
Ch2多項式函數 2-2 多項式的運算與應用 影音錄製:陳清海老師 資料提供:龍騰文化事業股份有限公司.
第一章 直角坐標系 1-3 函數圖形.
估計與假設檢定.
第一章.
Definition of Trace Function
第 一 章 多元迴歸分析.
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
第 15 章 複迴歸 © 滄海書局.
CH05. 選擇敘述.
大綱:加減法的化簡 乘除法的化簡 去括號法則 蘇奕君 台灣數位學習科技股份有限公司
微積分網路教學課程 應用統計學系 周 章.
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
圓的定義 在平面上,與一定點等距的所有點所形成的圖形稱為圓。定點稱為圓心,圓心至圓上任意一點的距離稱為半徑,「圓」指的是曲線部分的圖形,故圓心並不在圓上.
10-6 CONTROL CHARTS FOR MONITORING VARIABLITY
上課大綱 迴歸係數的區間估計與假設檢定 統計顯著性與經濟顯著性 迴歸模型中的點預測與區間預測 配適度分析(變異數分析)
第一章.
Chapter 4 迴歸分析. Chapter 4 迴歸分析 迴歸分析原理 迴歸分析的目的在於找出一條最能夠代表所有觀測資料(樣本點)的函數(迴歸估計式),用這個函數代表應變數和自變數之間的關係 多變量分析—管理上的應用.
第 2 章 迴歸分析的推論.
反矩陣與行列式 東海大學物理系‧數值分析.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
1-1 二元一次式運算.
Linear Regression Analysis 5E Montgomery, Peck & Vining
簡單線性迴歸模型:隨機解釋變數與時間落差分配模型
第一章 直角坐標系 1-3 函數及其圖形.
4-1 變數與函數 第4章 一次函數及其圖形.
政治大學財政所與東亞所選修--應用計量分析--中國財政研究 黃智聰
解下列各一元二次方程式: (1)(x+1)2=81 x+1=9 或 x+1=-9 x=8 或 x=-10 (2)(x-5)2+3=0
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

第 6 章 複迴歸之一

6.1複迴歸模型 需要多個預測變數 雙預測變數的第一階模型 當有兩個預測變數X1與 X2時,迴歸模型為: (6.1) 假設 ,則模型(6.1)迴歸函數為: (6.2) 圖6.1所示為以下反應平面的部份圖示: (6.3)

迴歸係數的意義 用前面的案例說明,當X2固定在水準X2 = 2時,迴歸函數(6.3)成為: (6.4)

超過兩個預測變數的第一階模型 現在考慮一個配適有p – 1 個預測變數 的迴歸模型: (6.5) 上面的迴歸模型稱為「具p – 1個預測變數的第一階模型」,此模型也可以寫成: (6.5a) 或令,則可以寫成: (6.5b) 假設,則迴歸模型(6.5)的反應函數為: (6.6)

一般線性迴歸模型 在迴歸模型中變數 ,所代表的意義不一定是完全不同或沒有關係的預測變數(例如Xk可以是X1 · X2),因此我們定義下面的一般線性迴歸模型: (6.7) 其中, 為參數, 為已知之常數, 獨立服從 i = 1,…, n

如果令 ,則迴歸模型(6.7)可以寫成: (6.7a) 或 (6.7b) 因為 ,所以迴歸模型(6.7)的反應函數為 (6.8) 所以具有常態誤差項的一般線性迴歸模型隱含著觀 測值Yi為相互獨立、服從平均數 、變異數 之常態分配。

個預測變數 質性的預測變數 考慮利用病患年齡(X1)與性別(X2)預測在醫院中的住院天數(Y),定義X2如下: 則第一階迴歸模型為: (6.9) 其中

迴歸模型(6.9)的反應函數為: (6.10) 對男性病患而言,X2 = 0,所以反應函數(6.10)成為: (6.10a) 對女性病患而言,X2 = 1,所以反應函數(6.10)成為: (6.10b) 一般而言,當質性變數有c種分類情形時,模型中需要c – 1個指標變數來描述,在住院天數的案例中,殘障程度是一個質性變數,它可以用下面的兩個指標變數來描述:

於是透過病患年齡、性別、殘障程度所構成的第一階迴歸模型為: (6.11) 其中,

多項式迴歸 反應函數為曲線型式,下面是單一預測變數多項式迴歸模型的一種情形: (6.12) 經轉換後之變數 變數經過轉換後的模型可能含有複雜的曲線型式反應函數,不過它仍是一般線性迴歸模型的特例,考慮下面這個變數Y經轉換後的模型: (6.13) 此模型的反應曲面雖然複雜,不過還是可以依照一般線性迴歸模型來處理。令 ,則迴歸模型(6.13)成為:

很多模型可以轉換成一般線性迴歸模型,例如: (6.14) 進行 的變數轉換,它就是一個一般線性迴歸 模型: 交互作用 一般線性迴歸模型(6.7)也包含了不可加性或具有交互作用效應的,例如下面的雙預測變數模型: (6.15) 此時由於交互作用項存在模型中,造成反應函數複雜化,但是迴歸模型(6.15)仍然是一個一般線性迴歸模型,當我們令,則迴歸模型(6.15)可以寫成:

組合情形 考慮下面的迴歸模型: (6.16) 該模型中同時有預測變數的線性項、二次項與代表交互作用效應的交叉乘積項,我們定義: 則迴歸模型(6.16)可以寫成:

一般線性迴歸模型中的線性意義 所謂對參數線性是指模型可以寫成: (6.17) 其中 是由預測變數的水準所決定出的值

6.2 矩陣形式下的一般線性迴歸模型 在將一般線性迴歸模型(6.7)用矩陣的形式來表示前,先定義下列矩陣: 其中 (6.18)

所以接下來可以用矩陣的形式來表示一般線性迴歸模型(6.7)如下: (6.19) 其中 Y為反應向量, 為參數向量, X為常數矩陣, 為獨立常態隨機變數之向量

,共變異矩陣為: 因此隨機向量Y之期望值 為: (6.20) 而Y之共變異矩陣與 相同為: (6.21)

6.3 迴歸係數的估計 將(1.8)中的最小平方準則推廣至一般線性迴歸模型(6.7)中,成為: (6.22) 最小平方估計量就是在滿足能使Q最小化的 ,用向量b表示所得到的最小平方估計量 : (6.23)

一般線性迴歸模型(6.19)的最小平方標準方程式為: (6.24) 而最小平方估計量b為: (6.25) 根據常態誤差迴歸模型(6.19)所得到的最大概似估計 量與(6.25)的最小平方估計量b相同,我們可以先將 (1.26)的概似函數推廣至複迴歸模型,如下: (6.26)

6.4 配適值及殘差 將配適值 組成向量 ,殘差項 組成殘差向量e: (6.27)

我們可以將配適值向量 與殘差向量e分別表示成: (6.28) (6.29) 將配適值 用H矩陣表示為: (6.30) 其中, (6.30a)

同樣地,殘差向量e可以表示為: (6.31) 而共變異矩陣則可以表示為: (6.32) 其估計式為 (6.33)

6.5 變異數分析的結果 平方和與均方 變異數分析的平方和透過(5.89)可以用矩陣表示為: (6.34) (6.35) (6.36)

在表6.1中列出了上面的變異數分析結果以及均方 MSR與MSE: (6.37) (6.38) 迴歸關係的F檢定 現在我們先考慮反應變數Y與預測變數 間是否存在迴歸關係之檢定,虛無假設與對立假設分別為: (6.39a)

採用檢定統計量: (6.39b) 控制型一錯誤的機率不大於 ,決策法則為: (6.39c)

複判定係數 我們用 表示,其定義為: (6.40) 它是用來表示Y的總變異中與預測變數 有關的部份,當p – 1 = 1時,則複判定係數 成為(2.72)的簡單判定係數 ,複判定係數 與簡單判定係數 有相同的範圍限制: (6.41) 當所有 為0時(k = 1,…, p–1), 之值為零,當所有的觀測值Y均落於所配適的迴歸曲面上時,亦即 ,此時 =1。

由於 之值會因為採用大量的預測變數X而增大, 有些學者建議採用調整的複判定係數,用符號 表 示,其定義為: (6.42) 複相關係數 複相關係數是複判定係數 的正平方根R: (6.43) 當迴歸模型(6.19)中只有一個預測變數X,也就是當p–1 = 1時,複相關係數R等於(2.73)中相關係數r的絕對值。

6.6 迴歸參數的推論 最小平方估計量與最大概似估計量b為不偏之估計量: (6.44) 其共變異矩陣: (6.45)

可以藉由下面的公式算出: (6.46) 而估計的共變異矩陣 : (6.47) (6.48)

的區間估計 對於常態誤差迴歸模型(6.19),有下面的推論: (6.49) 因此關於信賴係數 下 的信賴區間為: (6.50) 的檢定 關於的檢定: (6.51a)

可以採用檢定統計量: (6.51b) 檢定的法則為: (6.51c) 聯合推論 Bonferroni聯合信賴區間可用於同步估計數個迴歸係數,若要進行全族信賴係數 下的g個(g ≤ p)參數的聯合估計: (6.52) 其中, (6.52a)

6.7 平均反應的估計與新觀測值的預測 的區間估計 給定 的值為 ,其平均 反應為 ,定義向量 為: (6.53) 給定 的值為 ,其平均 反應為 ,定義向量 為: (6.53) 則所要估計的平均反應 為: (6.54)

我們用 表示對應向量 的平均反應之估計: (6.55) 上面的估計量也是一個不偏的估計量: (6.56) 其變異數為: (6.57) 可以將上面的變異數轉換為估計係數的共變異矩陣 之函數: (6.57a)

估計的變異數 如下: (6.58) 的 信賴界線為: (6.59) 迴歸曲面的信賴域 在 的水準下 的信賴域之邊界點,可以根據下面的公式得到: (6.60) 其中, (6.60a)

多個平均反應的同步信賴區間 在全族信賴係數 下,要估計在不同的 水準下,多個平均反應 的同步信賴區間,可以採用下面的兩種方法: 1.對於所關心的 ,利用(6.60)的Working-Hotelling 信賴域界線: (6.61) 2.採用Bonferroni同步信賴區間,如果要同時進行g 個區間估計,則Bonferroni信賴界線為: (6.62)

其中, (6.62a) 新觀測值的預測 對應於一個特定水準 ,一個新觀測值 的 預測界線為: (6.63) (6.63a)

預測 處下的m個觀測值之平均 如果我們在 處下抽選m個新觀測值,則可以預測其平均數 的 預測界線: (6.64) 其中, (6.64a) g個新觀測值的預測 在全族信賴係數 下,g個不同 水準下的新觀測值之預測問題,根據Scheffé同步預測程序,其預測界線為:

(6.65) 其中, (6.65a) 當然,我們也可以利用Bonferroni同步預測程序, 在全族信賴係數 下,對g個不同 水準下進 行新觀測值之預測: (6.66) (6.66a) 隱藏的外插之注意事項

6.8 診斷與矯正測量

散佈圖矩陣 相關矩陣是散佈圖矩陣的一個有用的輔助工具,此矩陣包含了Y與其他預測變數間,兩兩的簡單相關係數,其排列形式如同散佈圖矩陣: (6.67) 三維散佈圖 殘差圖 常態性的相關檢定 常數變異數的Brown-Forsythe 檢定 常數變異數的Breusch-Pagan 檢定

配適不良的F檢定 SSPE的自由度為(n – c),SSLF的自由度為(n – p) – (n – c) = c – p,所以針對下面的檢定: (6.68a) 檢定統計量為: (6.68b) 其中SSLF與SSPE如(3.24)與(3.16)所示,最後我們有決策法則: (6.68c)

矯正測量 Box-Cox轉換

6.9 雙預測變數的複迴歸案例

案例介紹 從圖6.4a中的SYGRAPH散佈圖矩陣來看,似乎可以預期為具有常態誤差的第一階迴歸模型: (6.69) 基本計算 Dwaine工作室案例之X與Y如下: (6.70)

我們需先計算: 1. 結果為: (6.71)

2. 結果為: (6.72)

3. 應用(5.23)可以得到結果: (6.73)

代數等式 在第一階迴歸模型(6.69)中的 為: 或是: (6.74)

關於雙預測變數下的第一階迴歸模型(6.69), 為: (6.75) 迴歸函數的估計 從(6.25)中可以立即利用(6.72)與(6.73)計算最小平方估計量b:

結果為: (6.76)

標準方程式的代數版本 雙預測變數下的標準方程式之代數式可以透過(6.74)與(6.75)得出: 因此有下面的標準方程式: (6.77)

配適值及殘差 模型配適度分析

變異數分析 迴歸關係的檢定 複判定係數

迴歸參數的估計 首先我們需先計算共變異矩陣的估計量 : 在圖6.5a中已經輸出了MSE,而 則在(6.73)中計算過,所以: (6.78)

平均反應的估計 變異數估計量 的代數版本 利用(6.58) 在雙預測變數的第一階模型中,我們有: (6.79)