Download presentation
Presentation is loading. Please wait.
1
自相关
2
假设1:给定X1i, X2i,… Xki时,εi的条件分布均值为零。
即:随机误差项具有零均值。
3
假设2 随机误差项彼此之间不相关 假定3 球型扰动项(spherical disturbance), 即对于解释变量的所有观测值,随机误差项有相同的方差。扰动项满足“同方差”、“无自相关”的性质
5
u的方差协方差矩阵 经典假设 自相关 异方差
6
如果存在自相关:随机误差项的方差-协方差矩阵的非主对角线上的元素不为0 。
7
异方差经常出现在截面数据中,因为在截面数据中经常会出现 的情况。
解决方法:异方差稳健的标准差。 FGLS(可行性广义最小二乘法) 自相关经常出现在时间序列数据中,因为在时间序列数据中,经常会出现的 的情况。 面板数据可以看作是截面数据和时间序列的集合,所以既有可能出现异方差,又有可能出现自相关。
8
截面数据的残差图
9
时间序列数据的残差图
10
自相关包含一阶自相关和高阶自相关。 一阶自相关: 高阶自相关:
11
由于经济活动通常具有某种连续性或持久性,自相关现象在时间序列中很常见。比如,相邻两年的GDP 增长率、通货膨胀率。又比如,某个意外事件或新政策的效应需要逐步地随时间推移而释放出来;滞后的调整过程,比如,最优资本存量需要通过若干年的投资才能逐渐达到。
12
例如,绝对收入假设下居民总消费函数模型: Ct=0+1Yt+εt t=1,2,…,n
再比如大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。 例如,绝对收入假设下居民总消费函数模型: Ct=0+1Yt+εt t=1,2,…,n 由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关 )。
13
其中ρ称为相关系数
14
多阶自相关的数学形式
16
自相关的检验 1. 图形法 残差与X的散点图 自相关图(auto-correlation cofficient)
1. 图形法 残差与X的散点图 自相关图(auto-correlation cofficient) 偏自相关图(partial auto-correlation cofficient)
17
例题:利用B2_lutkepohl.dta数据集建立消费和收入之间的一元线性回归模型。并检验是否存在自回归,是一阶还是高阶。
use B2_lutkepohl.dta, clear tsset year reg consum income predict e1, res scatter e1 income,yline(0) ac e1 pac e1
18
2。DW检验:只能检验一阶自相关的序列相关形式,并且要求解释变量严格外生。
根据样本个数和自由度查表得到DL和DU,并且构造不同的区域。
22
D.W. 统计量: 杜宾和沃特森他们成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。
23
(2)给定,由n和k的大小查DW分布表,得临界值dL和dU
(3)比较、判断
24
4-dU <D.W.<4- dL 不能确定 4-dL <D.W.<4 存在负自相关
dL<D.W.<dU 不能确定 dU <D.W.<4-dU 无自相关 4-dU <D.W.<4- dL 不能确定 4-dL <D.W.< 存在负自相关 不能确定 不能确定 无自相关 正相关 负相关 dL dU dU 4-dL
25
经验上DW值1.8---2.2之间接受原假设,不存在一阶自相关。
Stata中对方程进行回归后直接使用 dwstat命令即可。 reg consum income dwstat
26
Box-Pierce Q 检验和Bartlett检验 (Ljung and Box, 1979)
28
Q检验和Bartlett检验 reg consum income predict e2,res wntestq e2 wntestb e2
30
Breusch-Godfrey(LM) 检验
reg consum income bgodfrey
31
自相关的处理: 1。使用“OLS + 异方差自相关稳健的标准差”(Heteroskedasticity and Autocorrelation Consistent Standard Error,简记HAC),即在同时存在异方差与自相关的情况下也成立的稳健标准差。这种方法被称为Newey and West (1987)估计法,它只改变标准差的估计值,并不改变回归系数的估计值。
32
Newey 稳健型估计(White1980估计的扩展)
reg consum income newey consum income , lag(1) newey consum income , lag(2)
33
广义差分法: CO-PW方法 Cochrane-Orcutt(1949) 估计(舍弃第一期观察值)
Prais-Winsten(1954) 估计(对第一期观察值进行处理 sqrt(1-rho^2)*y1)
36
关键问题是,差分的结果一定会损失一个样本(第一个样本)。CO和PW方法给了不同的处理方式。CO为了计算方便而将第一个方程(即第一个观测数据)删去。 PW不删去第一个样本,而是用sqrt(1-rho^2)*y1)加以估计。 由于时间序列的数据往往较少,所以尽量不损失样本
37
广义差分法: CO-PW方法 广义差分的stata命令: prais y x1 x2 x3 (使用默认的PW方法)
prais y x1 x2 x3, corc (使用CO方法) prais consum income,corc prais consum income
38
一个例子:考察英国政府如何根据长期利率(r20)的变化来调整短期利率(rs),数据集为ukrates.dta (1)做如下回归: ,其中: 回归方程为: use ukrates,clear tsset month reg D.rs LD.r20
39
自相关检验 1。图形法:自相关系数和偏自相关系数 predict e1,res ac e1 pac e1
corrgram e1,lag(10)
40
2。DW检验: reg D.rs LD.r20 dwstat 3。Q检验和Bartlett检验 predict e2,res wntestq e2 wntestq e2,lag(2) wntestb e2
41
4。对于高阶自相关的检验方法:B-G检验 bgodfrey bgodfrey,lag(2)
42
自相关的处理 1. 使用OLS+异方差自相关稳健的标准误(HAC)
方法被称为Newey-West估计法(Newey and West,1987) reg D.rs LD.r20 newey D.rs LD.r20 ,lag(1)(假设存在一阶自相关) newey D.rs LD.r20 ,lag(2) (假设存在二阶自相关) 系数完全相同,但标准差和t值不同。
43
可行广义最小二乘法(FGLS):广义差分法:
CO-PW方法Cochrane-Orcutt(1949) 估计(舍弃第一期观察值) Prais-Winsten(1954) 估计(对第一期观察值进行处理 sqrt(1-rho^2)*y1)
44
Cochrane-Orcutt(1949) 估计(舍弃第一期观察值)
prais D.rs LD.r20,corc Prais-Winsten(1954) 估计(对第一期观察值进行处理 sqrt(1-rho^2)*y1) prais D.rs LD.r20 时间序列一般样本不会太大,因此不要轻易舍弃。
45
多重共线性 直观上说:当模型的R2非常高,但多数解释变量都不显著,甚至系数符号相反,可能存在多重共线性
完全的多重共线性stata会自动drop掉,例如 gen dom=1-foreign reg price weight length foreign dom 多重共线性的检验:膨胀因子 estat vif 经验上当 (1) VIF 的均值 >=2 (2) VIF 的最大值 接近或者超过10 认为有较为严重的多重共线性。
46
多重共线性的处理 1。不作处理:如果模型重点关注的是整体对被解释变量的解释能力,而不是具体回归系数是否显著,则可不处理。
2。不作处理:如果存在多重共线性,但变量显著,此时消除多重共线性,只会使变量更加显著,此时可不作处理。 3。删除引起多重共线性的某个变量。 4。合并引起多重共线性的变量,例如,a和b是引起多重共线性的变量,引入新变量c=a/b,同时删除a和b。 5。增大样本容量。
47
reg price mpg weight length foreign
estat vif 还可以利用解释变量的相关系数 pwcorr mpg weight length foreign 结论:weight和length具有严重的多重共线性 可以考虑去掉weight。 reg price mpg length foreign pwcorr mpg length foreign 多重共线性基本消除
Similar presentations