第八章迴歸分析假設條件之檢定及補救措施 2018/11/28.

Slides:

Advertisements

Similar presentations

因果图. 因果图因果图的适用范围如果在测试时必须考虑输入条件的各种组合，可使用一种适合于描述对于多种条件的组合，相应产生多个动作的形式来设计测试用例，这就需要利用因果图。因果图方法最终生成的就是判定表。它适合于检查程序输入条件的各种组合情况。因果图的适用范围如果在测试时必须考虑输入条件的各种.

Advertisements

第七章求职方法和技巧（二）主讲人：谭琳. 第一节自荐一、目前常见的自荐种类 1 ．口头自荐 1 ．口头自荐 2 ．书面自荐 2 ．书面自荐 3 ．广告自荐 3 ．广告自荐 4 ．学校推荐 4 ．学校推荐 5 ．他人推荐 5 ．他人推荐.

2010高考科学备考策略夯实基础抓纲织网掌握技巧提高能力辽宁省实验中学徐广宇 2010年9月13日.

专业课程设计古祭文赏析主讲教师：邹自平.

窦娥冤关汉卿感天动地元·关汉卿.

第五章主张超尘绝俗的佛家.

计量经济学第五章异方差性.

四川省省级精品课程《实变函数论》绪论主讲人：魏勇.

理论联系实践理论就是，什么都懂，但什么都不会用实践就是，什么都不懂，却什么都会用理论联系实践就是，什么都不会用

关于市场营销的分析 ——以九阳豆浆机为例品牌经营——让每一个家庭都拥有一台九阳豆浆机营销管理——采取文化、概念、网络等营销组合

國中基本能力測驗（基測）報告人：魏麗琴老師.

知其不可而为之.

先秦诸子散文.

珠海市夏湾中学曾雪静引言：清朝是中国最后一个封建王朝，共有12位皇帝。他们各有个的故事，有的开创了“盛世”有的则把清朝推向灭亡。下面，请看清朝列位皇帝简介清朝皇帝史.

第一讲：春江花月夜张若虚.

过秦论贾谊.

中国画家协会理事、安徽省美术家协会会员、工艺美术师、黄山市邮协常务理事余承平主讲

第二课扬起自信的风帆我能“行”.

综合实践活动课怎样预防传染病长江路小学苏文华.

第二章语音第六节音变轻声1.

《考试大纲》对本考点提出的能力要求是：识记现代汉字的字形。据此，高考对汉字的笔画、笔顺、造字法等内容均不作考查，只考查现代使用的汉字字形的识记能力。命题的依据是《现代汉语常用字表》，包括2000个常用字和1000个次常用字。考查重点为词语(包括成语)中的同音字、音近字、形近字。本考点的能力层级为A。

第四章回归假设的二级检验: 计量经济学检验

人教新课标版（2013修订）初中七上《寓言四则》.

团队介绍（1）西湖区社区街道挂职社会实践基地（2）武义、缙云、双浦乡镇挂职社会实践基地（3）BOX企业实习社会实践基地

基于新理念、新技术的“翻转课堂” 孟世敏武夷学院数字学习协同创新中心东方潜能脑认知结构成像实验室武夷学院“数字学习协同创新中心”

李逵见宋江.

第十二章心理测验的编制一、确定测验的目的二、分析测量目标三、测题的产生四、测验的标准化五、测验基本特征的鉴定六、编写测验指导书.

汉字的构造.

诵读欣赏古代诗词三首.

授课教师简历刘付才，男，中学高级教师，亳州一中南校体育教研组长，全国体育优质课一等奖获得者，华佗五禽戏第五十八代传承人；长期从事五禽戏教学和研究工作，参与创编了国家级课题“校园五禽戏”； 2014年全国学生运动会展示中获得优秀表演奖； 2015年指导的五禽戏传人进行的五禽戏教学获得全国一等奖，编著的《华佗五禽戏之简易健身操》即.

洪涝灾害重点传染病的预防江苏省疾病预防控制中心汪华.

11. Pearson’s Correlation & Simple Linear Regression

“海鸥老人”——吴庆恒.

護理理論期末報告(99上學期) 指導老師：謝春滿老師護理系進修部1-3組第三組

小桔灯市场赢利能力与战略主讲：杨贤耀.

我国减速机行业现状和技术发展趋势乔华山.

践行新时期广东精神推进广东公路文化繁荣与发展 ——关于广东省公路文化建设与实践的思考

通渭县第二中学PPT课件制作张鸿.

导入新课：莲花，自古以来就被人们看作是美丽圣洁的象征。我们一起先来欣赏一下莲的形象，然后请同学说说你觉得莲花美在哪里。

STATISTICA統計軟體的應用第二講:廻歸與ANOVA

鲁智深倒拔垂杨柳施耐庵罗贯中.

贴近教学服务师生方便老师.

SPSS軟體與迴歸分析南台科技大學企管系呂金河.

“体育与健康”课程介绍尹林教授.

六年级语文下册第四单元指尖的世界.

（浙教版）四年级品德与社会下册共同生活的世界第四单元世界之窗第二课时.

第十六章　無母數統計陳順宇教授成功大學統計系.

关于虚拟变量回归模型教学目的：了解虚拟变量的含义及使用，能够应用软件进行实例模拟。教学内容：虚拟变量的基本含义及使用

第六章正态条件下回归的推论.

第十八章簡單線性迴歸模型 18.1 前言 18.2 簡單線性迴歸模型 18.3 簡單線性迴歸模型的估計量 18.4 簡單線性迴歸模型的驗証

量化研究與統計分析比較平均數 Test 謝寶煖台灣大學圖書資訊學系 2006年4月1日.

統計基本觀念壹、資料資料來源：實驗之量測結果，抽樣調查結果，公告資料。一、資料類型

同学们，你们做过梦吗？你们都梦到过什么呢？.

政治大學財政所與東亞所選修--應用計量分析--中國財政研究黃智聰

第四章多重共线性.

授課內容：簡單線性迴歸模型：報告結果與選擇函數型式

EXCEL+ORIGN+SPSS的描述统计

第1章数据的描述性分析 1.1 数据的数字特征数据分析研究的对象是数据，一元数据是个观测值

第二章经典线性回归模型：双变量线性回归模型

第四章迴歸分析應注意之事項.

闭上眼睛就可以做梦，深夜里的清梦，大白天的美梦。阿德做梦了，他梦见了很多，你做过什么样的梦？

Xián 伯牙绝弦安徽淮南市八公山区第二小学　陈燕朵.

政治大學公企中心必修課-- 社會科學研究方法（量化分析）--黃智聰

第 1 章單一預測變數線性迴歸.

30 “年”的来历.

Presentation transcript:

第八章迴歸分析假設條件之檢定及補救措施 2018/11/28

迴歸分析的假設條件條件常態分配變異數同質性殘差獨立性（無自我相關） 2018/11/28

條件常態分配對於預測變數的各個水準，反應變數均呈現常態分配。迴歸模式中的常態分配指的是條件常態分配，即給定 x 值後 y 的分配是常態分配，至於全部的 y 值是否為常態分配並不是要求的條件。迴歸分析對常態分配的假設也與 t 檢定、F 檢定一樣具有穩健性（Robust），也就是說，當資料偏離常態不是很嚴重時，仍可接受常態分配的假設條件成立。 2018/11/28

誤差項 i 的常態假設誤差項 i 的平均值為零，即 E(i ) ＝0 誤差項 i 的變異數相等，即 Var(i ) ＝σ2 誤差項 i 之間無自我相關，即 Cov(i ,j) ＝0 , i≠j 誤差項 i 服從常態分配，即 i ~ ~N(0, σ2) i.i.d 2018/11/28

為何需要條件常態分配的假設︿︿因為 OLS 估計量 β0 和 β1 都是 i 的線性函數，而按假設 i 是隨機的，因此，OLS 估計量的抽樣分配或機率分配將依賴於 i 假設的機率分配。因為必須知道這些估計量的機率分配，方能對它們的母體值進行推論，所以為了假設檢定，必須先對 i 的機率分配作出假設。 2018/11/28

為何需要條件常態分配的假設因為誤差項 i 代表沒有納入迴歸模型的其他所有影響因素，而在這些影響因素中，每種因素對 Y 的影響都很微弱。常態變數的線性函數仍服從常態分配。 2018/11/28

為何需要條件常態分配的假設由於 Yi ＝ β0 ＋ β1Xi ＋ i ，而因為 β0 和 β1 是常數，Xi 也是給定的值，所以 Yi 是 i 的線性組合。因此，若 i ~ N (0, σ2)，則 Yi ~ N ( β0＋β1Xi , σ2) 2018/11/28

為何需要條件常態分配的假設︿︿︿︿因為 β0 和 β1 是 Yi 的線性組合，所以β0 和 β1 也是常態分配。因此， β0 ~ N (β0 , σ02)， β1 ~ N ( β1 , σ12) 有了殘差項的常態分配假設，才能推出 β0 和β1 的抽樣分配，也才能做迴歸參數的假設檢定︿︿︿︿ 2018/11/28

條件常態分配的診斷方法畫殘差值的直方圖畫殘差值的常態機率圖殘差值之偏態與峰度的檢定 Shapiro-Wilk (W)檢定 Kolmogorov-Smirnov (D) 檢定 Jarque-Bera (J-B) 檢定 2018/11/28

畫殘差值的直方圖次數 -3σ -2σ -1σ 0 1σ 2σ 3σ 殘差 2018/11/28

畫殘差值的常態機率圖在 X 軸上標出 OLS 殘差值，在 Y 軸上標出如果服從常態分配變數所對應的期望值。若殘差值的常態機率圖呈現從左下到右上之 450 線，則資料符合常態分配。 2018/11/28

畫殘差值的常態機率圖殘差期望值殘差值次數殘差 -3σ -2σ -1σ 0 1σ 2σ 3σ ＊＊＊＊＊＊＊＊＊＊ -3σ -2σ -1σ 0 1σ 2σ 3σ 殘差殘差值 2018/11/28

畫殘差值的常態機率圖殘差期望值殘差值次數殘差 -3σ -2σ -1σ 0 1σ 2σ 3σ ＊＊＊＊＊＊＊＊＊＊ -3σ -2σ -1σ 0 1σ 2σ 3σ 殘差殘差值 2018/11/28

條件常態分配的檢定殘差值之偏態與峰度若殘差值之偏態(Skewness)與峰度(Kurtosis)之絕對值均小於 2，則誤差項呈現常態分配。若殘差值之偏態(Skewness)與峰度(Kurtosis)之絕對值均大於 2，則誤差項不是常態分配。 2018/11/28

條件常態分配的檢定 Shapiro-Wilk (W) 假如樣本數小於或等於2,000，SAS是採用Shapiro-Wilk (W) 統計檢定。理論上，W 檢定統計量介於 0 與 1 之間。當 W 檢定統計量愈小時（即愈接近 0 時），愈容易拒絕虛無假設，即殘差值不符合常態分配。當 W 檢定統計量愈大時（即愈接近 1 時），愈不容易拒絕虛無假設，即殘差值符合常態分配。 2018/11/28

Kolmogorov-Smirnov (D) 條件常態分配的檢定 Kolmogorov-Smirnov (D) 假如樣本數大於2,000，SAS是採用 Kolmogorov-Smirnov (D)統計檢定。理論上，當 D 檢定統計量愈大時，愈容易拒絕虛無假設，即殘差值不符合常態分配之統計前提。當 D 檢定統計量愈小時，愈不容易拒絕虛無假設，即殘差值符合常態分配之統計前提。在數值的精確性上， Shapiro-Wilk (W)統計檢定法較Kolmogorov-Smirnov (D)統計檢定法精確。 2018/11/28

條件常態分配的檢定 Jarque-Bera 檢定常態性的 J-B 檢定是一項漸近或大樣本檢定，它仍以 OLS 殘差為依據。此檢定法先計算 OLS 殘差的偏態和峰度，再使用下列檢定統計量，其中S代表偏態，K代表峰度：在殘差項為常態分配的虛無假設下，Jarque & Bera 證明了上式所給的 JB 檢定統計量漸近地遵循自由度為 2 的 X2 分配。 2018/11/28

對原始資料做 Box-Cox 變數變換 Y* = Yλ 違反常態分配假設的處理 H0：資料符合常態分配 H1：資料不符合常態分配對原始資料做 Box-Cox 變數變換 Y* = Yλ 改用對數線性模型或其他非線性模型 2018/11/28

變異數的同質性對於預測變數的各個水準，反應變數的變異數是同質的，即具有相同的變異數 σ2。「同質性」指的是不論甚麼樣的 X 值，Y 分配的變異數均相等。 2018/11/28

異質變異數的後果 OLS 估計量仍是線性的和不偏的。 OLS 估計量不再具有最小變異數，即不再是有效的，即使對大樣本也是如此。建立在 t 分配和 F 分配之上的信賴區間和假設檢定是不可靠的。︿ 2018/11/28

異質變異數的診斷方法畫殘差圖 White 的一般異質性變異數檢定其他異質性變異數檢定方法 2018/11/28

異質變異數的殘差檢定殘差的變異數隨 x 增大而增大採用加權最小平方法估計及檢定 2018/11/28

異質變異數的殘差檢定殘差的變異數隨 x 增大而變小採用加權最小平方法估計及檢定 2018/11/28

White 的一般異質性變異數檢定假設有如下模型： Yi ＝ β0 + β1X1i + β2X2i ＋ i 設立虛無假設和對立假設如下： H0：變異數是同質的 H1：變異數是異質的 2018/11/28

White 的一般異質性變異數檢定 (1) 用 OLS 估計原始迴歸式並求得殘差。 (2) 對殘差取平方，然後用 OLS 跑下式輔助迴歸 ei 2＝ A0 + A1X1i + A2X2i + A3X1i2 + A4X2i2 ＋ A5X1i X2i+ vi (3)求輔助迴歸式的 R2 值，在不存在異質變異數的虛無假設下，White 證明出 n × R2 會服從卡方分配，自由度為輔助迴歸式中解釋變數的個數。 n × R2 ~ X2k-1 2018/11/28

White 的一般異質性變異數檢定 (4) －(1) 若檢定統計量 n × R2 的值大於顯著水準 α 之下 X2k-1 的臨界值，或者檢定統計量 n × R2 所對應的 p 值小於 0.05，則拒絕虛無假設，表示殘差項具有異質變異數。 (4) －(2) 若檢定統計量 n × R2 的值小於顯著水準 α 之下 X2k-1 的臨界值，或者檢定統計量 n × R2 所對應的 p 值大於 0.05，則不拒絕虛無假設，表示殘差項不具有異質變異數。 2018/11/28

異質性變異數的處理若檢定結論不拒絕虛無假設，表示並無充分證據顯示殘差項具有異質變異數，則原始迴歸式只要用 OLS 估計即可。若檢定結論為拒絕虛無假設，表示有充分證據顯示殘差項具有異質變異數，此時應採用 White 的方法修正估計量的標準誤，或用加權最小平方法來估計原始迴歸式，或是重新設定模型，例如以對數形式估計模型。 2018/11/28

異質性變異數的處理加權最小平方法：σi2 已知時考慮以下迴歸模型： Yi ＝ β0 + β1X1i ＋ i var( i ) ＝ σi2 假設誤差變異數 σi2 已知，則以其標準差 σi 為權數，對原始迴歸模型做如下的變換： Yi 1 X1i i ＝ β0 ( ) ＋ β1 ( ) ＋ σi σi σi σi 2018/11/28

異質性變異數的處理加權最小平方法：σi2 已知時令 vi ＝ ( i / σi ) var (vi) ＝ var ( i / σi ) ＝ ( 1/ σi2 ) var ( i ) ＝ ( 1/ σi2 ) (σi2 ) ＝ 1 變換後的誤差項 vi 是同質變異的，因此，變換後的模型不存在異質變異數的問題，可以用 OLS 方法進行估計。 2018/11/28

異質性變異數的處理加權最小平方法：σi2 未知時考慮以下迴歸模型： Yi ＝ β0 + β1X1i ＋ i var( i ) ＝ σ2 Xi 假設誤差變異數 σi2 未知，只知道誤差變異數和 Xi 成比例，則以 Xi 的平方根為權數，對原始迴歸模型做如下的變換： i Yi 1 X1i ＝ β0 ＋ β1 ( ) ＋ ( ) √Xi √Xi √Xi √Xi 2018/11/28

異質性變異數的處理加權最小平方法：σi2 未知時令 vi ＝ ( i / ) var (vi) ＝ var ( i / ) ＝ ( 1/ ( ) 2 ) var ( i ) ＝ ( 1/ Xi ) (σ2 Xi) ＝ σ2 變換後的誤差項 vi 是同質變異的，因此，變換後的模型不存在異質變異數的問題，可以用 OLS 方法進行估計。 √Xi √Xi √Xi 2018/11/28

White 異質性變異數調整標準誤在存在異質性變異數的情況下，OLS 估計量仍是不偏的，但卻不具最小變異性，因此是無效的。在異質性變異數的情況下，以 OLS 得到的估計量的標準誤和 t 統計量都是偏誤的。 White 建立了一種估計方法，利用這種方法得到的迴歸係數的估計量標準誤考慮了異質變異數的存在，因而可以使用 t 檢定和 F 檢定。 White 的方法論是建立在大樣本基礎之上的，其 OLS 估計量是漸近有效的，即對大樣本是有效的 2018/11/28

殘差項的獨立性「獨立性」指的是前一個誤差不會影響後一個誤差，也就是資料具有相同的分配且獨立（誤差項不具有自我相關）。檢定方法：畫殘差圖 Durbin-Watson d 檢定其他誤差項自我相關檢定方法 (連檢定) 2018/11/28

殘差有自我相關的後果 OLS 估計量仍是線性的和不偏的。 OLS 估計量不再具有最小變異數，即不再是有效的，即使對大樣本也是如此。建立在 t 分配和 F 分配之上的信賴區間和假設檢定是不可靠的。通常計算的 R2 不能測度真實的 R2 。︿ 2018/11/28

殘差自我相關的診斷方法畫殘差圖 Durbin-Watson d 檢定其他誤差項自我相關檢定方法 (連檢定) 2018/11/28

殘差項自我相關的殘差檢定殘差有趨勢項 2018/11/28

加入趨勢項 Yi ＝ β0 + θT + β1X1i ＋ i 2018/11/28

殘差項自我相關的殘差檢定殘差項有二次項 2018/11/28

加入二次項 Yi ＝ β0 + θT + β1X1i + β2X21i ＋ i 2018/11/28

殘差項自我相關的殘差檢定殘差項自我相關改用時間數列分析的方法 2018/11/28

Durbin-Watson 自我相關檢定基本假設 (2)解釋變數 X 是非隨機變數，即在重複抽樣中變數 X 的值是固定的。 (3)誤差項的生成機制是： εi ＝ ρεi -1 + vi －1＜ρ ＜1 (4)解釋變數中不包含反應變數的落後項。 Yi ＝ β0 +β1X1i + β2Yi-1 ＋ i 2018/11/28

Durbin-Watson 自我相關檢定步驟 (1)進行 OLS 迴歸並獲得殘差 ei 。 (2)依公式計算檢定統計量 d 值。 (3)根據樣本數及解釋變數的個數，從 D-W 表中查出對應的臨界 dL 和 dU。 (4)按照 D-W 判定規則表中的規則進行決策判斷 2018/11/28

Durbin-Watson 自我相關檢定判定規則拒絕H0 正自我相關拒絕H0* 負自我相關無法判斷無法判斷不拒絕H0或 H0* 無正負自我相關 0 dL dU 2 4-dU 4-dL 4 2018/11/28

Durbin-Watson 自我相關檢定判定規則虛無假設統計量判斷結果表示無正自我相關 0<d<dL 拒絕有正自我相關 dL≦d≦dU 無法判斷其他方法無負自我相關 4-dL<d<4 有負自我相關 4-dU≦d≦4-dL 無正或負自我相關 dU<d<4-dU 不拒絕 2018/11/28

D-W 檢定落入無法判定域之修訂 (1) H0：ρ＝0 對 H1：ρ＞0。若估計的 d＜dU，則在顯著水準 α 上拒絕 H0：ρ＝0，表示具有統計上顯著的正相關。 (2) H0：ρ＝0 對 H1：ρ＜0。若估計的 (4－ d)＜dU，則在顯著水準 α 上拒絕 H0：ρ＝0，表示具有統計上顯著的負相關。 (3) H0：ρ＝0 對 H1：ρ≠0。若估計的 d＜dU或 (4－ d)＜dU，則在顯著水準 2α 上拒絕 H0：ρ＝0，表示具有統計上顯著的自我相關 2018/11/28

違反殘差獨立性的補救措施 (1) 盡力查明自我相關是純粹自我相關，而不是模型設定偏誤造成的 (加入趨勢項或二次項)。 (1) 盡力查明自我相關是純粹自我相關，而不是模型設定偏誤造成的 (加入趨勢項或二次項)。 (2) 若是純粹自我相關，則可對原模型做適當的變換 ( 廣義最小平方法 GLS )。 (3) 在大樣本之下，用 Newey-West 的 HAC 法，以得到 OLS 估計量在對自我相關加以修正之後的標準誤 ( 類似 White 的方法 )。 (4) 若是小樣本，而且 ρ＜0.3，則用 OLS 即可 2018/11/28

違反殘差獨立性的補救措施改用時間數列分析的方法 2018/11/28