第六章 自相关
本章主要内容 自相关的定义和产生原因; 自相关的影响; 自相关的检验; 自相关的补救;
6.1 自相关的定义、类型、产生原因 6.1.1 自相关(autocorrelation)定义: 6.1 自相关的定义、类型、产生原因 6.1.1 自相关(autocorrelation)定义: 在古典线性回归模型中,我们假定随机扰动项序列的各项之间不相关。如果这一假定不满足,则称之为自相关。即用符号表示为: 常见于时间序列数据。
简单记号
定义:自相关系数
6.1.2 类型:一阶自相关
一阶自回归 为随机变量且满足经典假设 >0,正自相关 :自相关系数 <0,负自相关
类型:高阶自相关
6.1.3 产生自相关的原因
计量经济学家的话 没有普遍有效的方法能够防止把回归函数的错误设定误解为自相关的出现!
二、设定偏误1:应含而未含变量的情形
三、设定偏误2:不正确的函数形式 例如:如果真实的回归方程形式为: 其中,因变量为边际成本,解释变量为产出及产出的平方。 如果作回归是选用的是: 则会出现自相关,其形式为:
四、蛛网现象 许多农产品的供给表现出一种所谓的蛛网现象。 例如,供给价格的反应要滞后一个时期。今年种植的作物是受去年流行的价格影响的,因此,相关的函数形式是: 这时我们就不能期望扰动项是无自相关的。
五、滞后效应 例如:在消费支出对收入的时间序列分析中,当期的消费支出除了依赖于其他变量外,还依赖于前期的消费支出。即: 如果作回归是选用的是: 则会出现自相关。
六、 数据的“编造” 在经验分析中,许多数据是经过加工而成的。例如,在用到季度数据的时间序列回归中,季度数据通常由月度数据加总而成。 这种平均的计算减弱了每月的波动而引进了数据的匀滑性 。
时间序列数据存在序列相关性 ---自相关也可能出现在横截面数据中,但更一般 出现在时间序列数据中。 被解释变量除了受制于模型中的解释变量的影响而外,还受到其他因素的作用,如果这种作用具有连续性,一定也会带给被解释变量连续性的影响,即样本点的前后相关。 这是因为被解释变量与随机误差项具有相同的分布(只有数学期望不同而已)。若被解释变量相关,那么随机误差项的前后期之间也必定相关。变量自身前后期间的相关,故称作自相关。 模型设计时,将对被解释变量有影响的因素并入到随机误差项之中,如果这些被遗漏的解释变量的作用成为误差项的主要成分,它们会产生出系统性的、一贯性的作用,从而造成即随机误差项前后期之间存在相关性。
为什么会出现序列相关性?下面通过两个例子加以说明。 例如,建立行业生产函数模型,以产出量为被解释变量,资本、劳动、技术为解释变量,选择时间序列数据作为样本观测值。于是有: t=1,2,…,n 在该模型中,政策因素等,没有包括在解释变量中,但它们对产出量是有影响的,该影响被包含在随机误差项中。如果该影响构成随机误差项的主要部分,则可能出现序列相关性。 如果政策因素对前一年产出量的影响是正的,后一年的该影响往往也是正的。于是在不同的样本点之间,随机误差项出现了相关性,这就产生了序列相关性。 实例
6.2 自相关的后果 OLS估计得到的虽然仍为线性、无偏估计 参数估计量非有效性 即使在大样本下仍不具有渐进有效性 变量的显著性检验失效 6.2 自相关的后果 OLS估计得到的虽然仍为线性、无偏估计 参数估计量非有效性 即使在大样本下仍不具有渐进有效性 变量的显著性检验失效 模型预测失败
6.3 自相关的检验 6.3.1 图解法 时间序列图(Time Sequence plot):将残差对时间描点。 6.3 自相关的检验 6.3.1 图解法 时间序列图(Time Sequence plot):将残差对时间描点。 如图(a)所示,扰动项的估计值呈循环形,并不频繁 地改变符号,而是相继若干个正的以后跟着几个负的。 表明存在正自相关。 t (a)
自相关的检验:图解法 t (b) 如(b)图所示,扰动项的估计值呈锯齿状,随时间 逐次改变符号,表明存在负相关。
6.3.2 自相关的检验: DW检验 DW检验(Durbin-Watson) DW检验是检验自相关的最著名的、最常用的方法。 1、使用条件 (1)、回归模型中含有截距项; (2)、解释变量是非随机的(因此与随机扰动项不 相关) (3)、随机扰动项是一阶自相关; (4)、回归模型中无滞后因变量做解释变量; (5)、没有缺落数据,样本比较大。
DW检验
自相关的检验:DW检验(续) 正相关 无自相关 负相关 dL dU 2 4-dU 4-dL 4 d
DW检验:检验判断 对给定样本大小和给定解释变量个数找出 临界值,按照上面的图做出决策。 例:查DW表,对于31个观测值和一个解释 变量,我们得到dL=1.363和dU=1.496 (5%的显著水平)
总结 D.W. 0时,模型存在完全一阶正相关 D.W. 4时,模型存在完全一阶负相关 当D.W.值在2左右时,模型不存在一阶自相关
(1)从判断准则看到,存在两个不能确定的D.W.值区域,这是这种检验方法的一大缺陷。 注意: (1)从判断准则看到,存在两个不能确定的D.W.值区域,这是这种检验方法的一大缺陷。 (2)D.W.检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关(即是自相关,在这里看成是等价的); (3)经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关。 所以在实际应用中,对于序列相关问题一般只进行D.W.检验。
6.4 自相关的补救1: ( 已知)广义差分法
未知时,自相关的补救:方法2、3
迭代法:停止条件
4. 德宾两步法 第一步:求出自相关系数 的估计值 差分形式 应用最小二乘法,求出 的估计值 第一步:求出自相关系数 的估计值 差分形式 应用最小二乘法,求出 的估计值 第二步:利用 进行广义差分变换,对差分模型用OLS估计参数值
举例 P256